پایگاه داده برداری (Vector Database) یک سیستم ذخیره سازی اطلاعات است که از بُردارهای عددی برای نمایش دادهها استفاده میکند. این بردارها معمولاً ویژگیهای مختلفی از اطلاعات را نمایش میدهند. (آموزش هوش مصنوعی بهصورت کاربردی در نیک آموز)
چند ویژگی مهم این نوع پایگاه داده عبارتند از:
این ویژگیها باعث میشود پایگاه داده برداری یک ابزار قدرتمند برای ذخیره، جستجو و دسترسی به اطلاعات مختلف باشد. با آموزش LLM، مهارت خود را در هوش مصنوعی افزایش دهید.
1.200.000 تومان قیمت اصلی: 1.200.000 تومان بود.720.000 تومانقیمت فعلی: 720.000 تومان.
در طی این جلسه شما با مباحث زیر آشنا خواهید شد:
▪️ بررسی انواع ساختارهای دادهای
▪️ بررسی انواع بانکهای اطلاعاتی
▪️ Vector Database چیست؟
▪️ Embedding Model اساس کار Vector Database ها
▪️ Vector Database ها چگونه کار میکنند؟
▪️ بررسی مرحله Indexing در Vector Database ها
▪️ بررسی مرحله Querying در Vector Database ها
پردازش Unstructured Data همیشه یکی از چالشهایی بوده که خیلی از دوستانی که با این نوع دادههای کار میکنند، با آن درگیر هستند.
برای مثال، من همیشه دوست داشتم که بتوانم برنامهای بنویسم که امکان جستجو بر پایه عکس را داشته باشد. به طور خیلی ساده، تعدادی عکس در بانک اطلاعاتی خودم دارم، یک عکس جدید بهعنوان ورودی به سیستم میدهم و میگویم عکسهایی شبیه به این را به من تحویل بده.
در گذشته برای انجام این کار باید درگیر هوش مصنوعی و… میشدیم، اما درحال حاضر انجام این کار با استفاده از Vector Database ها به راحتی آب خوردن است. برای انجام این کار کافی است:
ذخیره سازی داده
▪️ داده موردنظر (در اینجا عکس) را با استفاده از کتابخانههای Embedding به وکتور تبدیل نمایید.
▪️ داده وکتورشده را در Vector Database ذخیره کنید تا ایندکس شود.
جستجوی داده
▪️ با استفاده از عملیات Similarity Search موجود در Vector Database ، جستجو داده وکتور را انجام داده و نزدیکترین رکوردها به وکتور موردنظر را بازیابی نمایید.
▪️ تبریک میگویم! شما N تصاویر مشابه را استخراج کردهاید.
▪️ تمام شد.
در طی این جلسه، شما با مباحث زیر آشنا خواهید شد:
▪️ کاربردهای Vector Database ها
▪️ LLM ها و Vector Database ها
▪️ چند نمونه کاربرد واقعی از Vector Database ها
▪️ معرفی چند Vector Database
▪️ مزایا و معایب Vector Database ها
▪️ بررسی Milvus بهعنوان Vector Database
▪️ بررسی Redis بهعنوان Vector Database
▪️ بررسی LanceDB بهعنوان Vector Database
یکی از پایگاه دادههای قویای که بهعنوان Vector Database در سطح Enterprise فعالیت دارد، Milvus است. این پایگاه داده توانایی مدیریت و جستجوی دادههای بُرداری را دارد. از نمونه کاربردهای Milvus میتوان به امکان پیادهسازی جستجو براساس محتوای متن، تشخیص الگو، جستجو براساس محتوای تصویر، جستجو براساس محتوای صدا و… اشاره کرد.
از نمونه ویژگیهای Milvus میتوان به موارد زیر اشاره کرد:
▪️ Open Source بودن آن
▪️ پشتیبانی از انواع دادههای بُرداری مانند وکتورها، ماتریسها و تنسورها
▪️ امکان جستجوی نزدیکترین همسایهها براساس فاصله یا شباهت کیفیتی
▪️ امکان اضافهکردن، حذفکردن و بهروزرسانی دادهها بهصورت پویا
▪️ پشتیبانی از معماریهای مختلف مانند CPU، GPU
▪️ امکان ایجاد ایندکسهای بهینه برای بهبود عملکرد جستجوی دادهها
▪️ و…
در طی این جلسه، ما بهصورت عملی با بانک اطلاعاتی LanceDB کار خواهیم کرد. مباحث این جلسه شامل موارد زیر است:
▪️ آشنایی با نحوه نصب و راهاندازی LanceDB بهصورت Embedded Database
▪️ آشنایی با نحوه ایجاد بانک اطلاعاتی در LanceDB
▪️ آشنایی با نحوه ایجاد جدول در LanceDB
▪️ آشنایی با نحوه انجام عملیات CRUD در LanceDB
▪️ آشنایی با ایندکس Full Text در LanceDB
▪️ کار با مثالهایی که دارای داده فارسی در LanceDB
برای کار با LanceDB ما پکیجهای مربوط به آن را در پایتون نصب و راهاندازی خواهیم کرد و با چند خط دستور، یک بانک اطلاعاتی در کنار Application خود ایجاد خواهیم کرد. به این نوع بانکهای اطلاعاتی در اصطلاح Embedded Database میگویند.
در طی این جلسه، ما بهصورت عملی یک پیادهسازی یک مثال با استفاده از LanceDB برای جستجوی معنایی را انجام خواهیم داد. مباحثی که در این جلسه بررسی خواهد شد به شرح زیر است.
در طی این جلسه، ما بهصورت عملی یک پیادهسازی یک مثال با استفاده از Vector Database برای جستجوی تصویر را انجام خواهیم داد. مباحثی که در این جلسه بررسی خواهد شد به شرح زیر است.
مسعود طاهری مدرس و مشاور ارشد SQL Server & BI مدیر فنی پروژههای SQL Server و هوش تجاری در نیک آموز، رئیس واحد دیتابیس شرکت پرداخت الکترونیک سداد، کارشناس ارشد تحلیل و طراحی شرکت تجارت الکترونیک پارسیان (PEC co).،مدرس دوره ۲۵ جلسه ای آموزش Performance Tuning در SQL Server،مدرس دوره ۲۵ جلسهای هوش تجاری در SQL Server، مدرس دوره High Availability در SQL Server، سخنران همایش معرفی قابلیت های جدید SQL Server 2016، سخنران بخش هوش تجاری همایش مورد تایید مایکروسافت در سال ۲۰۱۷ در ایران، مشاور SQL Server در شرکت مهندسی رایورز، سازمان کشتیرانی کل کشور و شرکت توسعه رفاه پردیس (بانک رفاه)، مدرس دورههای سازمانی از جمله سازمان بورس، کشتیرانی، شونیز، سازمان زندانها، مرکز آمار ایران، رایورز و…،متخصص، مدرس و مشاور SQL Server و مباحث فوق پیشرفته بانک اطلاعاتی و هوش تجاری می باشد.
حمیدرضا حداد متخصص، مشاور و مدرس سیستم های هوش تجاری ، مشاور هوش تجاری در شرکت آوا سلامت ، مدرس علم داده در دانشگاه تهران، همراه اول، ایرانسل و … مؤلف کتاب پیش پردازش دادهها با پایتون (انتشارات سنجاق)، مؤلف کتاب یکصد چالش کوئری برای یک تحلیلگر داده (انتشارات سنجاق)، مؤلف کتاب آموزش جامع Power […]
Δ
ذخیره نام، ایمیل و وبسایت من در مرورگر برای زمانی که دوباره دیدگاهی مینویسم.
آقا ما همچنان منتظر تکمیل دوره وکتور دیتابیس هستیم. فصل ۱ تا ۳ رو دیدم و حدود یک ماهه که منتظر ۴ و ۵ هستم. تو رو خدا زودتر . چرا اصلا یک زمان اعلام نمی کنید چطور میشه یک دوره را بخریم ولی نگید کی اماده می شود کاش از همون ابتدا بنویسید که چند ساعت. تکمیل شده چند ساعت باقی مانده و کی تکمیل می شود لطفا هر زمان بندی اعلام کنید همه پروژه ها زمانبندی دارند . من باورم نمیشه پروژه ای رو مسعود طاهری کار کنه و زمان بندی نداشته باشه.
سلام و عرض ادب ، وقت شما بخیر و شادی جناب رضایی بزرگوار دوره آموزش وکتور دیتابیس نهایتا تا اواخر شهریور ماه تکمیل خواهد شد .
از صبر و شکیبایی شما همراهان عزیز سپاس گزاریم