خانه نیک آموز نیوز Midjourney طاقچه بالا میگذارد، هوش مصنوعی Flux رونمایی میشود نیک آموز نیوز LLM نوشته شده توسط: تیم فنی نیک آموز تاریخ انتشار: ۲۳ مرداد ۱۴۰۳ آخرین بروزرسانی: 24 مرداد 1403 زمان مطالعه: 5 دقیقه ۵ (۱) بهلطف مهندسی داده و انقلاب هوش مصنوعی مولد، دیگر ساخت تصویر با دستورهای متنی غیرممکن نیست. اولین رهبر این عرصه Midjourney بود؛ اما این پلتفرم پس از مدتی، ساخت تصویر را فقط با خرید اشتراک مقدور کرد. همین دو روز پیش بود که ساخت تصویر با ChatGPT هم ممکن شد؛ اما با محدودیت دو تصویر در روز! پس استارتاپ آلمانی “Black Forest Labs” دستبهکار شد و هوش مصنوعی تبدیل متن به تصویر “Flux” را معرفی کرد. Flux یک مدل منبعباز است که برای دانلود و اجرا بهصورت محلی روی سیستم یا پلتفرمهایی مانند “Freepik”، “NightCafe” و “Hugging Face” در دسترس است. آشنایی با هوش مصنوعی Flux این استارتاپ سه مدل از Flux.1 را راهاندازی کرد: یک نسخه تجاری و قویترین نوع با نام “Pro”، نسخه میانرده با امکان اجرا روی کارت گرافیک قدرتمند با نام “Dev” برای استفادههای غیرتجاری و نسخه “Schnell” با حجم کم و سریعتر از Flux Dev. Black Forest Labs ادعا میکند که مدلهای آن از رقبای فعلی مانند Midjourney و DALL-E در زمینههایی مثل کیفیت تصویر و رعایت ترتیب اجرای دستورات متنی بهتر عمل میکنند. مدلهای FLUX.1 از چیزی که شرکت آن را «معماری هیبریدی» مینامد استفاده میکند. طبق توصیف “Black Forest Labs”، این معماری ترکیبی از تکنیکهای Transformer و Diffusion است که تا ۱۲ میلیارد پارامتر را پردازش میکند. بهنظر میرسد FLUX.1 در تولید دستهای انسان توانا باشد؛ چیزیکه در مدلهای قبلی و زمینه ترکیب تصاویر مانند Stable Diffusion 1.5 یک نقطه ضعف بود. البته این موضوع بهدلیل فقدان تصاویر آموزشی متمرکز بر دستها رخ میداد. از همان روزهای اولیه، تولیدکنندههای عکس با هوش مصنوعی مثل Midjourney بر تصویرسازی دستها تسلط داشتند؛ اما بهواقع جای یک AI متنباز که دستها را با دقت زیاد در حالتهای مختلف میسازد، خالی بود. تصاویر زیر را بههمراه پرامپت هرکدام میبینید. در این مقایسه که توسط یکی از کاربران مجله تکنولوژی “tom’s guide” تولید شده است، پرامپت به Flux و Midjourney داده شد و در نهایت، خروجیهای زیر را دریافت کرد. تصویر اول: سرآشپز در آشپزخانه این کاربر اولین تصویر را با جزئیات زیاد انتخاب کرد؛ بافت پیچیده پوست با محیط پویای آشپزخانه که آشپز اصلی آن، بانویی ۵۰ ساله با بافت ظریف پوستی است. نتیجه را در تصاویر زیر میبینید. همچنین در این پرامپت، روی ترسیم پسزمینهای با حضور سرآشپزها تأکید شده که نام هرکدام از آنها، روی یک «کت سفید مخصوص سرآشپز و بدون لکه» نشان داده شود. هوش مصنوعی Midjourney هوش مصنوعی Flux برنده: Midjourney: بهدلیل ایجاد بافت طبیعیتر پوست و ساخت شخصت اصلی بهشکل رئالیسم تصویر دوم: یک نوازنده خیابانی پرامپت بعدی از هر دو سازنده تصویر هوش مصنوعی میخواهد که یک نوازنده خیابانی را در اواخر دهه ۳۰ زندگیاش نشان دهند. این نوازنده در گوشه شهری شلوغ و میان نتهای موسیقی نواختهشده خودش گم شده است. بخشی از این پرامپت، مستلزم گنجاندن یک رهگذر قدردان، سکه در جعبه گیتار و زندگی شهری است که در پشت صحنه شخصیت اصلی تار میشود. هوش مصنوعی Midjourney هوش مصنوعی Flux برنده: Midjourney: بهدلیل واقعگرایی شخصیت، تصویرسازی ساختار، چیدمان و پسزمینه تصویر بهشکلی بهتر از Flux تصویر سوم: فضانورد بازنشسته این دستور را به هر دو AI دادیم تا یک فضانورد بازنشسته را در اواخر دهه ۶۰ زندگی خود بسازند. این فرد درحال ارائه مباحث حوزه فضا است. او در سلامت کامل جسمانی قرار دارد و یک پیکسل ناسا را هم به کت خود وصل کرده است. ما این پرامپت را طوری نوشتیم که پسزمینه با پوسترها، نقلقولها و افرادی که درحال صحبتکردن با او هستند، به تصویر کشیده شود. هوش مصنوعی Midjourney هوش مصنوعی Flux برنده: Flux: بهدلیل ترسیم شخصیت بهشکلی واقعی و انسانی، تصویرسازی دقیق بافت پوست، چیدمان و پسزمینه واقعیتر نسبتبه Midjourney، رندر بهتر متن روی تصویر بهنسبت Midjourney. چگونه از هوش مصنوعی Flux استفاده کنیم؟ ما برای استفاده از Flux، به پلتفرم Hugging Face مراجعه کردیم. در کادر “Enter your prompt”، تصویر مدنظرتان را با جزئیات کامل – شامل نوع عکس، زاویه دوربین، رنگها، پسزمینه و غیره – در قالب متن توصیف کرده و بنویسید و دکمه “Run” را بزنید. با کلیک روی گزینه “Advanced Settings” هم میتوانید سایز عکس و دیگر پارامترهای تصویر را مشخص کنید. چه رتبه ای میدهید؟ میانگین ۵ / ۵. از مجموع ۱ اولین نفر باش معرفی نویسنده مقالات 401 مقاله توسط این نویسنده محصولات 0 دوره توسط این نویسنده تیم فنی نیک آموز مقالات مرتبط ۲۳ شهریور دستهبندی نشده نیک آموز نیوز اولین مدل هوش مصنوعی OpenAI با قابلیت استدلال با نام o1 منتشر شد تیم فنی نیک آموز ۱۷ شهریور نیک آموز نیوز امیدی پرنور در راهکارهای سازمانی: Claude Enterprise نگین فاتحی ۱۱ شهریور نیک آموز نیوز هوش مصنوعی Magic میتواند ۱۰ میلیون خط کد را درک کند؛ انقلابی در توسعه نرمافزار تیم فنی نیک آموز ۰۹ شهریور نیک آموز نیوز گوگل هم آره؛ اینبار با ساخت چتبات اختصاصی در Gemini و پیشرفته شدن Imagen 3 نگین فاتحی دیدگاه کاربران لغو پاسخ دیدگاه نام و نام خانوادگی ایمیل ذخیره نام، ایمیل و وبسایت من در مرورگر برای زمانی که دوباره دیدگاهی مینویسم. موبایل برای اطلاع از پاسخ لطفاً مرا با خبر کن ثبت دیدگاه Δ