تکنولوژی بی‌نظیر گوگل و ایجاد بستری راحت برای ما؛ نسخه لایو جمنای وارد می‌شود

تکنولوژی بی‌نظیر گوگل و ایجاد بستری راحت برای ما؛ نسخه لایو جمنای وارد می‌شود

نوشته شده توسط: نگین فاتحی
تاریخ انتشار: ۲۷ مرداد ۱۴۰۳
آخرین بروزرسانی: 28 مرداد 1403
زمان مطالعه: 4 دقیقه
۰
(۰)

گوگل هفته گذشته و طی مراسم Made By Google برای رونمایی از سری پیکسل، هیجان و خوشحالی ما را به‌صورت رگ‌باری مورد هدف قرار داد. این غول محبوب سیلیکون‌ولی سخت‌افزارهای جدید را، از گوشی‌های هوشمند Pixel 9 گرفته تا هدفون‌های بی‌سیم – Pixel Buds Pro – معرفی کرد. 

اما بخش هیجان‌انگیز ماجرا، زیربنای این ابزارها، یعنی دستیار هوشمند مصنوعی Google Gemini بود. البته‌که این چت‌بات اوایل سال ۲۰۲۴ راه‌اندازی شد و درحال‌حاضر، دستیار پیش‌فرض سری Pixel 9 است. علاوه‌بر سری ۹ گوشی‌های پیکسل، این دستیار میلیون‌ها گوشی اندرویدی دیگر را در سراسر جهان همراهی می‌کند؛ اما راه جدیدی برای صحبت با این چت‌بات وجود دارد که در این مراسم معرفی شد: Gemini Live.

جمنای لایو

تکنولوژی جمنای لایو پاسخ گوگل به GPT-4o OpenAI است؛ راهی برای صحبت طبیعی با دستیارهای هوشمند که بسیار شبیه به مکالمه صوتی معمولی بین دو انسان است.

گوگل می‌گوید که این قابلیت به زبان انگلیسی برای مشترکان Gemini Advanced – مشترکانی که ماهانه ۲۰ دلار حق اشتراک پرداخت می‌کنند – منتشر می‌شود. فقط کافیست با ضربه‌زدن روی دکمه “Live” کوچک در سمت راست و پایین برنامه Gemini، از این قابلیت لذت ببرید. 

گوگل در ادامه اظهار کرد که در هفته‌های آینده، کاربران iOS و افراد سراسر دنیا با زبان‌های بیشتر هم می‌توانند از جمنای لایو استفاده کنند.

با Gemini Live می‌توانید به زبان انگلیسی صحبت کنید و مکالمه داشته باشید؛ حتی اگر گوشی‌تان قفل یا صفحه‌نمایش خاموش باشد. این قابلیت در Pixel Buds Pro 2 Google – هدفون‌های بی‌سیم گوگل – به‌شکل جذاب‌تری در دسترس است؛ می‌توانید بدون درآوردن گوشی و بدون دست با Gemini صحبت کنید.

درحال‌حاضر ۱۰ صدا در این دستیار تعبیه شده است که می‌توانید از میان تن‌ها، لهجه‌ها و سبک‌های مختلف، دلچسب‌ترین‌شان را  انتخاب کنید. وقتی مکالمه شما به‌اتمام رسید، یک رونویس کلی از آن را دارید که می‌توانید در هر زمانی به Gemini مراجعه و از آن استفاده کنید و به آن دسترسی داشته باشید.

حالا در جمنای لایو می‌توانید ایمیل‌های موجود در جیمیل‌تان را بررسی و درباره جزئیات آن، بدون کندوکاو یا خواندن کامل هر ایمیل، مطلع شوید؛ یا شاید یک دستور غذا را ببینید و از Gemini بخواهید که مواد اولیه آن را به لیست خرید در Google Keep اضافه کند. گوگل می‌گوید برنامه‌های دیگر مانند Keep، Tasks، Utilities، Calendar و YouTube Music در هفته‌های آینده به Gemini Live به‌صورت Extension افزوده خواهند شد.

تحول نتایج جستجو با Gemini Live

در این مراسم، گوگل قابلیت‌های خارق‌العاده Multimodal Search را لو داد. هوش مصنوعی چندوجهی می‌تواند ترکیبی از انواع محتوا را به شما تحویل دهد؛ یعنی دیگر در نتایج جست‌وجو، فقط متن نمی‌بینید، بلکه ترکیبی از متن، صوت، تصویر و ویدیو را به‌عنوان پاسخ سرچ خود دریافت خواهید کرد.

مدل چندوجهی Gemini می‌تواند با جستجو در محتوای مختلف، دسترسی شما را به اطلاعات عظیم اینترنت فراهم کند؛ بدون آن‌که مجبور به جابه‌جایی بین اپلیکیشن‌ها یا فرمت‌های مختلف باشید.

برای مثال، می‌توانید عکسی را در این موتور جستجو آپلود کنید و سؤال خود را در قالب دستور صوتی بپرسید. این قابلیت‌ با جمنای لایو ادغام شده و حالا می‌‌توانیم در لحظه‌ و به‌شکل زنده با این دستیار هوشمند، مکالمه کنیم و به‌صورت مستقیم به اپلیکیشن‌های دیگر هم دسترسی داشته باشیم.

پس خودتان را برای تجربه‌ای پربارتر و یک‌پارچه‌تر آماده کنید؛ جایی‌که امیدواری‌مان نسبت‌به کاهش زمان صرف‌شده برای کارهای تکراری بیشتر خواهد شد. در این حالت، فرآیند تحقیق و دسترسی به جدیدترین اطلاعات افزایش خواهد یافت و دیگر با الگوریتم E-E-A-T این موتور جستجو سروکله آن‌چنانی نخواهیم زد!

تفاوت جستجوی سنتی گوگل با نسخه مدرن در جمنای چندوجهی

 

ویژگی جستجوی سنتی (فعلی) گوگل جستجوی مدرن گوگل با کمک Gemini چندوجهی
تعامل کاربران با داده‌ها

– وارد کردن عبارت و کلمات کلیدی به‌شکل متنی در کادر جستجو گوگل

– اتکای کامل به الگوریتم‌ها و متن‌های گوگل

– متکی به جستجوی کلمات کلیدی

– واردکردن ورودی در قالب‌های متنوع محتوایی مانند متن، تصویر و صدا

– ترکیب چند نوع داده به‌شکل هم‌زمان در کسری از ثانیه

مثال: امکان آپلود تصویر و درخواست پاسخ‌دهی براساس عکس، توضیحات متنی، تحلیل صدا و پیشنهادات مرتبط

پردازش دستور و فرآیند جستجو

– جستجو براساس نمودار خطی و برپایه متن ورودی

– ارائه نتایج ازسوی گوگل به‌شکل لینک‌ها و توضیحات متنی

– ترکیب و پردازش همزمان داده‌های مختلف از منابع متعدد

مثال: ارائه اطلاعات متنی، نظرات کاربران و پیشنهاد ویدئوهای مرتبط ازسوی جمنای لایو فقط با آپلود یک تصویر 

تجربه کاربری – جابه‌جایی متعدد و چندباره بین اپلیکیشن، برنامه یا ابزارهای مختلف برای جستجوی داده‌های متفاوت

– فراهم‌کردن تجربه کاربری یکپارچه و بلادرنگ در یک UI واحد

– عدم نیاز به جابه‌جایی بین برنامه‌ها و ابزارها

– بهینه‌سازی تجربه به‌شکل بلادرنگ توسط کاربر

مثال: دریافت نتایج متنی، تصویری و ویدئویی در صفحه فعلی جستجو 

نحوه تعامل جستجوی گوگل و کیفیت خروجی‌های آن

– محدود به پاسخ‌های آماده و ساختارمند

– متکی به داده‌های موجود در پایگاه داده‌های فعلی گوگل

– پاسخ‌دهی به‌صورت بلادرنگ با توجه به ورودی‌های چندوجهی کاربران

– بهبود مداوم پاسخ‌دهی و شیوه‌های به‌کاررفته در طول زمان 

مثال: مکالمه زنده کاربر با جستجو در لحظه حال

 

چه رتبه ای می‌دهید؟

میانگین ۰ / ۵. از مجموع ۰

اولین نفر باش

گوش به زنگ یلدا
title sign
معرفی نویسنده
نگین فاتحی
مقالات
35 مقاله توسط این نویسنده
محصولات
0 دوره توسط این نویسنده
نگین فاتحی

از اسفند 99 مشغول گشت‌وگذار توی دنیای کلمات هستم؛ با این هدف که خوب بنویسم و این چشم‌انداز که کمک‌های موثری کنم. حالا سه‌ ساله که توی زمینه‌های گوناگون بازاریابی آنلاین مطالعه می‌کنم و یکی از حوزه‌های موردعلاقم، رفتارشناسی مخاطبان این فضا هست. دستاوردهای این مطالعه شده نوشتن محتوایی که امیدوارم شما بخونی، لُب‌کلام رو متوجه بشی، لذت ببری و با دست پر صفحه رو ترک کنی؛ شایدم بقیه نوشته‌هام رو بخونی :)

title sign
دیدگاه کاربران