رقیب سرسخت Midjourney از کمپانی گوگل؛ Imagen 3 با تصویرسازی بی‌نظیر آمد

رقیب سرسخت Midjourney از کمپانی گوگل؛ Imagen 3 با تصویرسازی بی‌نظیر آمد

نوشته شده توسط: نگین فاتحی
تاریخ انتشار: ۲۵ مرداد ۱۴۰۳
آخرین بروزرسانی: 28 مرداد 1403
زمان مطالعه: 4 دقیقه
۵
(۱)

Imagen 3 یک هوش مصنوعی تبدیل متن به تصویر که توسط آزمایشگاه پیشرفته AI گوگل، یعنی “DeepMind” ساخته شده است. این AI در مراسم Google I/O اعلام شد و پس از اتمام این مراسم، در اختیار کاربران قرار گرفت. البته در روزهای اولیه عرضه، Imagen 3 فقط برای کشورهای آمریکا، کنیا، نیوزیلند و استرالیا در دسترس بود. اما اکنون این مدل از پلتفرم آزمایشی “ImageFX Google AI Test Kitchen” قابل‌استفاده است. حال، لحظه‌شماری‌های‌مان برای دسترسی عمومی به این AI به پایان رسید و می‌توانیم همین حالا از آن استفاده کنیم.

هوش مصنوعی Imagen 3

با هوش مصنوعی Imagen 3 می‌توانید تصاویری با جزئیات بهتر، نورپردازی دقیق‌تر و جزئیات مصنوعی کمتری را نسبت‌به نسل‌های قبلی همین مدل بسازید. همچنین، درک سریع پرامپت و رندر متن، بهتر از قبل شده است.

این AI چند قابلیت هیجان‌انگیز و جذاب دارد تا ما را همین حالا ترغیب کرده و به‌سمت خود بکشاند. این قابلیت‌ها در ساخت تصاویر کامل و دقیق در سبک‌های هنری زیر خودنمایی می‌کنند:

  • فوتورئالیسم (Photorealism)
  • رنگ روغن (Oil Paintings)
  • هنرهای گرافیکی (Graphic Art)

نکته کاربردی و جالب: هوش مصنوعی Image 3 کلمات کلیدی دستور شما را شناسایی و چند سبک، فضا و محیط دیگر را پیشنهاد می‌دهد. این عوض‌کردن پارامترهای کلیدی تصویر، فقط با کلیک روی کلمات هایلایت‌شده به‌سادگی انجام می‌شود.

 

هوش مصنوعی Imagen 3

 

پس حالا که بی‌صبرانه مشتاق کشف قابلیت‌های این ماشین هوشمند شدیم، لباس غواصی‌مان را می‌پوشیم تا درون دریای عمیق و جذاب Imagen 3 شیرجه بزنیم!

تصویر اول: نمای ماکرو از یک قطره شبنم روی تار عنکبوت

هدف این پرامپت، آزمایش توانایی هوش مصنوعی Imagen 3 در به‌ تصویرکشیدن جزئیات میکروسکوپی است؛ بنابراین، دستور ایجاد تعامل بین نورهای پیچیده و یک محیط طبیعی را نوشتیم. 

در این پرامپت از Imagen 3 خواستیم که: «یک عکس ماکرو از یک قطره شبنم روی تار عنکبوت، که جزئیات پیچیده تار و انکسار نور را ازطریق قطره آب نشان می‌دهد. پس زمینه باید فوکوس ملایمی از یک جنگل سرسبز باشد.»

 

هوش مصنوعی Imagen 3

 

تصویر دوم: نمایی متضاد از مرغ مگس‌خوار

هدف این پرامپت، آزمایش تطبیق‌پذیری مدل در ایجاد سبک‌های هنری متضاد در یک تصویر واحد است. بنابراین جزئیات تصویر را به‌گونه‌ای تشریح کردیم که هوش مصنوعی Imagen 3 تصویری در سبک نقاشی‌های ونگوگ بسازد.

بنابراین، دستور را به‌شکل زیر نوشتیم: «یک تصویر تقسیم‌بندی‌شده ایجاد کن: در سمت چپ، یک نمای نزدیک واقعی از مرغ مگس‌خوار که از یک گل تغذیه می‌کند. در سمت راست، همان صحنه به‌عنوان یک نقاشی پرتلاطم و تلطیف‌شده با قلم موهای پررنگ و چرخان، رنگ‌های تند و حس حرکت و احساس در هر عنصر دوباره. آسمان باید دارای کیفیتی متلاطم و رویاگونه با ستارگان یا دوران‌های اغراق‌آمیز باشد.»

 

هوش مصنوعی Imagen 3

 

تصویر سوم: صحنه بازار Steampunk

با این دستور، می‌خواهیم توانایی Imagen 3 را برای ساختن یک صحنه پیچیده و دقیق با عناصر متعدد و شرایط نوری خاص به چالش بکشیم. 

پرامپت: «یک بازار شلوغ با تم Steampunk در غروب. در پیش‌زمینه، یک تاجر درحال نمایش خودکار ساعت برنجی به تماشاگران شگفت‌زده است. پس‌زمینه باید دارای کشتی‌های هوایی باشد که در سکوهای شناور پهلو می‌گیرند، با نور فانوس گرم که صحنه را روشن می‌کند.»

اولین تصویر از چهار تصویری که ایجاد کرد با پرامپت ما به‌صورت ۱۰۰% مطابقت داشت. همان‌طور که می‌بینید، نور همان چیزی است که انتظار داشتیم. این میزان از دقت و خروجی دقیق نشان می‌دهد که Imagen درک خوبی از دنیای واقعی دارد.

 

هوش مصنوعی Imagen 3

 

تصویر چهارم: کتابی با جلد بافت‌دار

ایجاد بافت‌های دقیق یا ظریف درحال‌حاضر برای بسیاری از مدل‌ها چالش‌برانگیز است؛ به‌طوری‌که گاهی منجربه ایجاد جلوه‌ای پلاستیکی می‌شود. پس در این پرامپت، هوش مصنوعی Imagen 3 را برای دقت در ساخت بافت آزمایش کردیم.

پرامپت: «یک گوشه مطالعه دنج با صندلی راحتی مخملی نرم، یک پتوی بافتنی درشت که روی آن پوشانده شده است و یک کتاب چرم روی صندلی. در کنار آن، یک میز کناری چوبی تراش‌خورده، یک فنجان چای چینی ظریف با طرح گل‌های پیچیده.»

یک نکته جالب در این پرامپت، قابلیت پیشنهاد Imagen است که هنوز هیچ هوش مصنوعی متن به تصویر به آن مجهز نشده است! در این پرامپت، ما توانستیم به‌راحتی فضای دنج را با فضای جادار، مطبوع و روشن عوض کنیم. حتی می‌توانستم گوشه مطالعه را به اتاق مطالعه، کتاب‌خانه و اتاق نشیمن تغییر دهیم.

بدیهی است که می‌توانید کل دستور را دوباره بنویسید؛ اما این پیشنهادها ایده‌های نابی هستند که به‌عنوان تغییرات ظریف برای تناسب با سبک درنظر می‌گیریم.

 

هوش مصنوعی Imagen 3

 

هوش مصنوعی Imagen 3

 

تصویر پنجم: فستیوال بازی

تست نهایی را با ساختن یک پوستر به پایان رساندیم. در این دستور تلاش کردیم توانایی این AI قدرتمند را برای مدیریت طیفی از سبک‎‌ها با عناصر متنی متعدد آزمایش می‌‎کنیم.

پرامپت: «یک پوستر شلوغ‌وپلوغ برای “Pixel Blast: Retro Gaming Festival” بساز. این طرح باید کلاژی از شخصیت‌ها و عناصر نمادین بازی‌های ویدئویی ۸ بیتی و ۱۶ بیتی داشته باشد. عنوان “PIXEL BLAST” باید بزرگ باشد، فونت هنری پیکسلی رنگارنگ در بالا قرار بگیرد، متن «جشنواره بازی‌های قدیمی» را با فونت کروم دهه ۸۰ در زیر تصویر اضافه کن. خطوط اسکن و افکت صفحه نمایش CRT را روی کل تصویر بگنجان.»

 

هوش مصنوعی Imagen 3

چه رتبه ای می‌دهید؟

میانگین ۵ / ۵. از مجموع ۱

اولین نفر باش

گوش به زنگ یلدا
title sign
معرفی نویسنده
نگین فاتحی
مقالات
35 مقاله توسط این نویسنده
محصولات
0 دوره توسط این نویسنده
نگین فاتحی

از اسفند 99 مشغول گشت‌وگذار توی دنیای کلمات هستم؛ با این هدف که خوب بنویسم و این چشم‌انداز که کمک‌های موثری کنم. حالا سه‌ ساله که توی زمینه‌های گوناگون بازاریابی آنلاین مطالعه می‌کنم و یکی از حوزه‌های موردعلاقم، رفتارشناسی مخاطبان این فضا هست. دستاوردهای این مطالعه شده نوشتن محتوایی که امیدوارم شما بخونی، لُب‌کلام رو متوجه بشی، لذت ببری و با دست پر صفحه رو ترک کنی؛ شایدم بقیه نوشته‌هام رو بخونی :)

title sign
دیدگاه کاربران