خانه نیک آموز نیوز تکنولوژی بینظیر گوگل و ایجاد بستری راحت برای ما؛ نسخه لایو جمنای وارد میشود نیک آموز نیوز LLM نوشته شده توسط: نگین فاتحی تاریخ انتشار: ۲۷ مرداد ۱۴۰۳ آخرین بروزرسانی: 28 مرداد 1403 زمان مطالعه: 4 دقیقه ۰ (۰) گوگل هفته گذشته و طی مراسم Made By Google برای رونمایی از سری پیکسل، هیجان و خوشحالی ما را بهصورت رگباری مورد هدف قرار داد. این غول محبوب سیلیکونولی سختافزارهای جدید را، از گوشیهای هوشمند Pixel 9 گرفته تا هدفونهای بیسیم – Pixel Buds Pro – معرفی کرد. اما بخش هیجانانگیز ماجرا، زیربنای این ابزارها، یعنی دستیار هوشمند مصنوعی Google Gemini بود. البتهکه این چتبات اوایل سال ۲۰۲۴ راهاندازی شد و درحالحاضر، دستیار پیشفرض سری Pixel 9 است. علاوهبر سری ۹ گوشیهای پیکسل، این دستیار میلیونها گوشی اندرویدی دیگر را در سراسر جهان همراهی میکند؛ اما راه جدیدی برای صحبت با این چتبات وجود دارد که در این مراسم معرفی شد: Gemini Live. جمنای لایو تکنولوژی جمنای لایو پاسخ گوگل به GPT-4o OpenAI است؛ راهی برای صحبت طبیعی با دستیارهای هوشمند که بسیار شبیه به مکالمه صوتی معمولی بین دو انسان است. گوگل میگوید که این قابلیت به زبان انگلیسی برای مشترکان Gemini Advanced – مشترکانی که ماهانه ۲۰ دلار حق اشتراک پرداخت میکنند – منتشر میشود. فقط کافیست با ضربهزدن روی دکمه “Live” کوچک در سمت راست و پایین برنامه Gemini، از این قابلیت لذت ببرید. گوگل در ادامه اظهار کرد که در هفتههای آینده، کاربران iOS و افراد سراسر دنیا با زبانهای بیشتر هم میتوانند از جمنای لایو استفاده کنند. با Gemini Live میتوانید به زبان انگلیسی صحبت کنید و مکالمه داشته باشید؛ حتی اگر گوشیتان قفل یا صفحهنمایش خاموش باشد. این قابلیت در Pixel Buds Pro 2 Google – هدفونهای بیسیم گوگل – بهشکل جذابتری در دسترس است؛ میتوانید بدون درآوردن گوشی و بدون دست با Gemini صحبت کنید. درحالحاضر ۱۰ صدا در این دستیار تعبیه شده است که میتوانید از میان تنها، لهجهها و سبکهای مختلف، دلچسبترینشان را انتخاب کنید. وقتی مکالمه شما بهاتمام رسید، یک رونویس کلی از آن را دارید که میتوانید در هر زمانی به Gemini مراجعه و از آن استفاده کنید و به آن دسترسی داشته باشید. حالا در جمنای لایو میتوانید ایمیلهای موجود در جیمیلتان را بررسی و درباره جزئیات آن، بدون کندوکاو یا خواندن کامل هر ایمیل، مطلع شوید؛ یا شاید یک دستور غذا را ببینید و از Gemini بخواهید که مواد اولیه آن را به لیست خرید در Google Keep اضافه کند. گوگل میگوید برنامههای دیگر مانند Keep، Tasks، Utilities، Calendar و YouTube Music در هفتههای آینده به Gemini Live بهصورت Extension افزوده خواهند شد. تحول نتایج جستجو با Gemini Live در این مراسم، گوگل قابلیتهای خارقالعاده Multimodal Search را لو داد. هوش مصنوعی چندوجهی میتواند ترکیبی از انواع محتوا را به شما تحویل دهد؛ یعنی دیگر در نتایج جستوجو، فقط متن نمیبینید، بلکه ترکیبی از متن، صوت، تصویر و ویدیو را بهعنوان پاسخ سرچ خود دریافت خواهید کرد. مدل چندوجهی Gemini میتواند با جستجو در محتوای مختلف، دسترسی شما را به اطلاعات عظیم اینترنت فراهم کند؛ بدون آنکه مجبور به جابهجایی بین اپلیکیشنها یا فرمتهای مختلف باشید. برای مثال، میتوانید عکسی را در این موتور جستجو آپلود کنید و سؤال خود را در قالب دستور صوتی بپرسید. این قابلیت با جمنای لایو ادغام شده و حالا میتوانیم در لحظه و بهشکل زنده با این دستیار هوشمند، مکالمه کنیم و بهصورت مستقیم به اپلیکیشنهای دیگر هم دسترسی داشته باشیم. پس خودتان را برای تجربهای پربارتر و یکپارچهتر آماده کنید؛ جاییکه امیدواریمان نسبتبه کاهش زمان صرفشده برای کارهای تکراری بیشتر خواهد شد. در این حالت، فرآیند تحقیق و دسترسی به جدیدترین اطلاعات افزایش خواهد یافت و دیگر با الگوریتم E-E-A-T این موتور جستجو سروکله آنچنانی نخواهیم زد! تفاوت جستجوی سنتی گوگل با نسخه مدرن در جمنای چندوجهی ویژگی جستجوی سنتی (فعلی) گوگل جستجوی مدرن گوگل با کمک Gemini چندوجهی تعامل کاربران با دادهها – وارد کردن عبارت و کلمات کلیدی بهشکل متنی در کادر جستجو گوگل – اتکای کامل به الگوریتمها و متنهای گوگل – متکی به جستجوی کلمات کلیدی – واردکردن ورودی در قالبهای متنوع محتوایی مانند متن، تصویر و صدا – ترکیب چند نوع داده بهشکل همزمان در کسری از ثانیه مثال: امکان آپلود تصویر و درخواست پاسخدهی براساس عکس، توضیحات متنی، تحلیل صدا و پیشنهادات مرتبط پردازش دستور و فرآیند جستجو – جستجو براساس نمودار خطی و برپایه متن ورودی – ارائه نتایج ازسوی گوگل بهشکل لینکها و توضیحات متنی – ترکیب و پردازش همزمان دادههای مختلف از منابع متعدد مثال: ارائه اطلاعات متنی، نظرات کاربران و پیشنهاد ویدئوهای مرتبط ازسوی جمنای لایو فقط با آپلود یک تصویر تجربه کاربری – جابهجایی متعدد و چندباره بین اپلیکیشن، برنامه یا ابزارهای مختلف برای جستجوی دادههای متفاوت – فراهمکردن تجربه کاربری یکپارچه و بلادرنگ در یک UI واحد – عدم نیاز به جابهجایی بین برنامهها و ابزارها – بهینهسازی تجربه بهشکل بلادرنگ توسط کاربر مثال: دریافت نتایج متنی، تصویری و ویدئویی در صفحه فعلی جستجو نحوه تعامل جستجوی گوگل و کیفیت خروجیهای آن – محدود به پاسخهای آماده و ساختارمند – متکی به دادههای موجود در پایگاه دادههای فعلی گوگل – پاسخدهی بهصورت بلادرنگ با توجه به ورودیهای چندوجهی کاربران – بهبود مداوم پاسخدهی و شیوههای بهکاررفته در طول زمان مثال: مکالمه زنده کاربر با جستجو در لحظه حال چه رتبه ای میدهید؟ میانگین ۰ / ۵. از مجموع ۰ اولین نفر باش معرفی نویسنده مقالات 35 مقاله توسط این نویسنده محصولات 0 دوره توسط این نویسنده نگین فاتحی از اسفند 99 مشغول گشتوگذار توی دنیای کلمات هستم؛ با این هدف که خوب بنویسم و این چشمانداز که کمکهای موثری کنم. حالا سه ساله که توی زمینههای گوناگون بازاریابی آنلاین مطالعه میکنم و یکی از حوزههای موردعلاقم، رفتارشناسی مخاطبان این فضا هست. دستاوردهای این مطالعه شده نوشتن محتوایی که امیدوارم شما بخونی، لُبکلام رو متوجه بشی، لذت ببری و با دست پر صفحه رو ترک کنی؛ شایدم بقیه نوشتههام رو بخونی :) مقالات مرتبط ۲۳ شهریور دستهبندی نشده نیک آموز نیوز اولین مدل هوش مصنوعی OpenAI با قابلیت استدلال با نام o1 منتشر شد تیم فنی نیک آموز ۱۷ شهریور نیک آموز نیوز امیدی پرنور در راهکارهای سازمانی: Claude Enterprise نگین فاتحی ۱۱ شهریور نیک آموز نیوز هوش مصنوعی Magic میتواند ۱۰ میلیون خط کد را درک کند؛ انقلابی در توسعه نرمافزار تیم فنی نیک آموز ۰۹ شهریور نیک آموز نیوز گوگل هم آره؛ اینبار با ساخت چتبات اختصاصی در Gemini و پیشرفته شدن Imagen 3 نگین فاتحی دیدگاه کاربران لغو پاسخ دیدگاه نام و نام خانوادگی ایمیل ذخیره نام، ایمیل و وبسایت من در مرورگر برای زمانی که دوباره دیدگاهی مینویسم. موبایل برای اطلاع از پاسخ لطفاً مرا با خبر کن ثبت دیدگاه Δ