Midjourney طاقچه بالا می‌گذارد، هوش مصنوعی Flux رونمایی می‌شود

Midjourney طاقچه بالا می‌گذارد، هوش مصنوعی Flux رونمایی می‌شود

نوشته شده توسط: تیم فنی نیک آموز
تاریخ انتشار: ۲۳ مرداد ۱۴۰۳
آخرین بروزرسانی: 24 مرداد 1403
زمان مطالعه: 5 دقیقه
۵
(۱)

به‌لطف مهندسی داده و انقلاب هوش مصنوعی مولد، دیگر ساخت تصویر با دستورهای متنی غیرممکن نیست. اولین رهبر این عرصه Midjourney بود؛ اما این پلتفرم پس از مدتی، ساخت تصویر را فقط با خرید اشتراک‌ مقدور کرد.

همین دو روز پیش بود که ساخت تصویر با ChatGPT هم ممکن شد؛ اما با محدودیت دو تصویر در روز!

پس استارتاپ آلمانی “Black Forest Labs” دست‌به‌کار شد و هوش مصنوعی تبدیل متن به تصویر “Flux” را معرفی کرد. Flux یک مدل منبع‌باز است که برای دانلود و اجرا به‌صورت محلی روی سیستم یا پلتفرم‌هایی مانند “Freepik”، “NightCafe” و “Hugging Face” در دسترس است.

آشنایی با هوش مصنوعی Flux

این استارتاپ سه مدل از Flux.1 را راه‌اندازی کرد: یک نسخه تجاری و قوی‌ترین نوع با نام “Pro”، نسخه میان‌رده با امکان اجرا روی کارت گرافیک قدرت‌مند با نام “Dev” برای استفاده‌های غیرتجاری و نسخه “Schnell” با حجم کم و سریع‌تر از Flux Dev. 

Black Forest Labs ادعا می‌کند که مدل‌های آن از رقبای فعلی مانند Midjourney و DALL-E در زمینه‌هایی مثل کیفیت تصویر و رعایت ترتیب اجرای دستورات متنی بهتر عمل می‌کنند.

مدل‌های FLUX.1 از چیزی که شرکت آن را «معماری هیبریدی» می‌نامد استفاده می‌کند. طبق توصیف “Black Forest Labs”، این معماری ترکیبی از تکنیک‌های Transformer و Diffusion است که تا ۱۲ میلیارد پارامتر را پردازش می‌کند. 

به‌نظر می‌رسد FLUX.1 در تولید دست‌های انسان توانا باشد؛ چیزی‌که در مدل‌های قبلی و زمینه ترکیب تصاویر مانند Stable Diffusion 1.5 یک نقطه ضعف بود. البته این موضوع به‌دلیل فقدان تصاویر آموزشی متمرکز بر دست‌ها رخ می‌داد. 

از همان روزهای اولیه، تولیدکننده‌های عکس با هوش مصنوعی مثل Midjourney بر تصویرسازی دست‌ها تسلط داشتند؛ اما به‌واقع جای یک AI متن‌باز که دست‌ها را با دقت زیاد در حالت‌های مختلف می‌سازد، خالی بود.

تصاویر زیر را به‌همراه پرامپت هرکدام می‌بینید. در این مقایسه که توسط یکی از کاربران مجله تکنولوژی “tom’s guide” تولید شده است، پرامپت به Flux و Midjourney داده شد و در نهایت، خروجی‌های زیر را دریافت کرد.

تصویر اول: سرآشپز در آشپزخانه

این کاربر اولین تصویر را با جزئیات زیاد انتخاب کرد؛ بافت پیچیده پوست با محیط پویای آشپزخانه که آشپز اصلی آن، بانویی ۵۰ ساله با بافت ظریف پوستی است. نتیجه را در تصاویر زیر می‌بینید. همچنین در این پرامپت، روی ترسیم پس‌زمینه‌ای با حضور سرآشپزها تأکید شده که نام هرکدام از آن‌ها، روی یک «کت سفید مخصوص سرآشپز و بدون لکه» نشان داده شود.

هوش مصنوعی Midjourney

 

هوش مصنوعی Midjourney

 

هوش مصنوعی Flux

 

هوش مصنوعی Flux

 

برنده: Midjourney: به‌دلیل ایجاد بافت طبیعی‌تر پوست و ساخت شخصت اصلی به‌شکل رئالیسم 

تصویر دوم: یک نوازنده خیابانی

پرامپت بعدی از هر دو سازنده تصویر هوش مصنوعی می‌خواهد که یک نوازنده خیابانی را در اواخر دهه ۳۰ زندگی‌اش نشان دهند. این نوازنده در گوشه شهری شلوغ و میان نت‌های موسیقی نواخته‌شده خودش گم شده است.

بخشی از این پرامپت، مستلزم گنجاندن یک رهگذر قدردان، سکه در جعبه گیتار و زندگی شهری است که در پشت صحنه شخصیت اصلی تار می‌شود.

هوش مصنوعی Midjourney

 

هوش مصنوعی Midjourney

 

هوش مصنوعی Flux

 

هوش مصنوعی Flux

 

برنده: Midjourney: به‌دلیل واقع‌گرایی شخصیت، تصویرسازی ساختار، چیدمان و پس‌زمینه تصویر به‌شکلی بهتر از Flux

تصویر سوم: فضانورد بازنشسته

این دستور را به هر دو AI دادیم تا یک فضانورد بازنشسته را در اواخر دهه ۶۰ زندگی خود بسازند. این فرد درحال ارائه‌ مباحث حوزه فضا است.

او در سلامت کامل جسمانی قرار دارد و یک پیکسل ناسا را هم به کت خود وصل کرده است. ما این پرامپت را طوری نوشتیم که پس‌زمینه با پوسترها، نقل‌قول‌ها و افرادی که درحال صحبت‌کردن با او هستند، به تصویر کشیده شود.

هوش مصنوعی Midjourney

 

هوش مصنوعی Midjourney

 

هوش مصنوعی Flux

 

هوش مصنوعی Flux

 

برنده: Flux: به‌دلیل ترسیم شخصیت به‌شکلی واقعی و انسانی، تصویرسازی دقیق بافت پوست، چیدمان و پس‌زمینه واقعی‌تر نسبت‌به Midjourney، رندر بهتر متن روی تصویر به‌نسبت Midjourney.

چگونه از هوش مصنوعی Flux استفاده کنیم؟

ما برای استفاده از Flux، به پلتفرم Hugging Face مراجعه کردیم. در کادر “Enter your prompt”، تصویر مدنظرتان را با جزئیات کامل – شامل نوع عکس، زاویه دوربین، رنگ‌ها، پس‌زمینه و غیره – در قالب متن توصیف کرده و بنویسید و دکمه “Run” را بزنید. 

 

چگونه از هوش مصنوعی Flux استفاده کنیم؟

 

با کلیک روی گزینه “Advanced Settings” هم می‌توانید سایز عکس و دیگر پارامترهای تصویر را مشخص کنید.

 

نحوه استفاده از flux

چه رتبه ای می‌دهید؟

میانگین ۵ / ۵. از مجموع ۱

اولین نفر باش

گوش به زنگ یلدا
title sign
معرفی نویسنده
تیم فنی نیک آموز
مقالات
401 مقاله توسط این نویسنده
محصولات
0 دوره توسط این نویسنده
تیم فنی نیک آموز
title sign
دیدگاه کاربران