خیانت در امانت اپل رو شد؛ آموزش هوش مصنوعی اپل با زیرنویس‌های یوتیوب بدون کسب اجازه

خیانت در امانت اپل رو شد؛ آموزش هوش مصنوعی اپل با زیرنویس‌های یوتیوب بدون کسب اجازه

نوشته شده توسط: تیم فنی نیک آموز
تاریخ انتشار: ۱۳ مرداد ۱۴۰۳
آخرین بروزرسانی: 24 مرداد 1403
زمان مطالعه: 3 دقیقه
۵
(۱)

تحقیقاتی از خبرگزاری Proof در ۱۷ جولای منتشر شد. این گزارش نشان داد که برخی از بزرگ‌ترین شرکت‌های فناوری جهان، ازجمله اپل و انویدیا، بدون اجازه تولیدکنندگان محتوا، مدل‌های هوش مصنوعی خود با زیرنویس‌های ویدئوهای یوتیوب آموزش می‌دهند.

گزارش حاضر شامل یک ابزار جستجو بود که تعیین می‌کرد آیا یک کانال یوتیوب در مجموعه داده‌های آموزشی قرار دارد یا خیر. این گزارش می‌گوید: «زیرنویس‌های ۱۷۳۵۳۶ ویدئوی یوتیوب، که از بیش‌از ۴۸۰۰۰ کانال استخراج شده‌اند، توسط شرکت‌های مطرح سیلیکون ولی ازجمله Anthropic، Nvidia، Apple و Salesforce استفاده شده است.»

برخی از کانال‌های یوتیوب که در مجموعه داده‌ها گنجانده شده‌اند، شامل لیست زیر هستند:

  • شوهای آخرشبی (Late-night Shows) مانند “The Late Show with Stephen Colbert” و “Jimmy Kimmel Live”؛
  • محتوایی از یوتیوبرهای محبوب ازجمله “MrBeast”، منتقد فناوری “Marques Brownlee” و “PewDiePie”.

Proof News گفت: «مجموعه داده‌ها از شرکتی به‌نام “Pile” تأمین می‌شوند که از یک نهاد غیرانتفاعی با نام “EleutherAI” تهیه شده‌اند.» 

در یک مقاله تحقیقاتی در سال ۲۰۲۰ مشخص شد که سازمان غیرانتفاعی Pile، حاوی ۲۲ مجموعه داده جداگانه است.

چالش تکامل هوش مصنوعی با داده‌های آموزشی

هوش مصنوعی همچنان یک فناوری کلیدی است که توسط غول‌های فناوری مانند اپل، گوگل، مایکروسافت، متا و آی‌بی‌ام دنبال می‌شود؛ اما تکامل این فناوری نیازمند تغذیه مدل‌های AI با حجم عظیمی از داده‌ها است. 

رهبران بازار ازجمله OpenAI، اذعان کرده‌اند که یافتن مجموعه‌های داده برای آموزش سیستم‌های هوش مصنوعی سخت‌تر و سخت‌تر می‌شود. این موضوع باعث شده است که OpenAI، خالق ChatGPT، با شرکت‌های محتوایی مثل “News Corp”. و “Reddit” مذاکره کند. هدف OpenAI این است که محتوا را برای تغذیه سیستم‌های هوش مصنوعی به‌دست آورد.

بااین‌حال، اطلاعات موجود در این گزارش نشان می‌دهد که شرکت‌های فناوری مانند اپل و انویدیا، در این فرآیند بی‌اخلاقی نشان دادند و ممنوعات را زیرپا گذاشتند؛ چون اطلاعاتی را برداشتند که حداقل ازنظر معنوی با رضایت محتواپردازان یوتیوب مطابقت نداشته است؛ داده‌هایی که از ویدیوها و زیرنویس آن‌ها استخراج کردند.

توجیه نقض قوانین با سپر کردن کمپانی Pile

سخنگوی Anthropic، استارتاپ هوش مصنوعی با منافع عمومی، به Proof News گفت: «از “Pile” برای آموزش دستیار هوش مصنوعی خود، یعنی “Claude” استفاده می‌کنیم.» سپس اضافه کرد که: «”The Pile” زیرمجموعه بسیار کوچکی از زیرنویس‌های یوتیوب را در خود گنجانده است.»

سخنگوی دیگری با نام جنیفر مارتینز (Jennifer Martinez) گفت: «شرایط استفاده از یوتیوب (YouTube’s Terms)، به‌کارگیری اطلاعات این پلتفرم را به‌صورت مستقیم توضیح داده است. این موضوع با استفاده از مجموعه داده‌های “The Pile” متفاوت است. درمورد نقض احتمالی شرایط خدمات YouTube، ما باید شما را به نویسندگان “The Pile” ارجاع دهیم.»

قوانین برای همه، به‌جز گوگل

همان‌طور که در این گزارش اشاره شد، کمپانی گوگل برای استخراج محتوای یوتیوب منعی ندارد. این شرکت به نیویورک تایمز گفت که توافق آن با سازندگان محتوا، امکان استفاده از محتوای یوتیوب را برای آموزش هوش مصنوعی فراهم می‌کند.

چه رتبه ای می‌دهید؟

میانگین ۵ / ۵. از مجموع ۱

اولین نفر باش

گوش به زنگ یلدا
title sign
معرفی نویسنده
تیم فنی نیک آموز
مقالات
401 مقاله توسط این نویسنده
محصولات
0 دوره توسط این نویسنده
تیم فنی نیک آموز
title sign
دیدگاه کاربران