نقش انباره داده در پروژه‌ های هوش تجاری

۴.۳
(۸)

انبار داده  یا Data Warehouse به مجموعه‌ای از داده‌ها گفته می‌شود که از منابع مختلف اطلاعاتی سازمان جمع‌آوری، دسته‌بندی و ذخیره می‌شود. پایگاه داده‌ای که برای گزارش‌گیری و تحلیل داده به کار می‌رود و به عنوان هسته اصلی یک سیستم هوش‌ تجاری به شمار می‌آید. از آن به عنوان قلب تپنده پروژه‌های هوش تجاری نام می‌برند. و ساختار آن به شکل D-Normal است. انبار داده به شکل کاملا مستقل نسبت به سایر بانک‌های اطلاعاتی ایجاد و طراحی گردد. و با پروسه‌ای به نام (Extract Transform and Load) که به معنای استخراج، پالایش و بارگذاری اطلاعات می‌باشد، اطلاعات و داده‌ها به انبار داده منتقل می‌شود.

دوره انبار داده در هوش تجاری

ویژگی‌های انباره داده:

داده‌های انبار داده از نگاه Inmon دارای ۴ ویژگی اصلی زیر هستند:
غیرفرار و ماندگار(Non-Volatile) هیچ رکوردی و یا داده‌ای Update نخواهد شد و صرفاً رکوردهایی که محتوای مقادیر جدید داده‌ها هستند، به سیستم اضافه خواهند شد.

موضوع گرا (Subject-Oriented)

منظور از “موضوع” پایه‌های اساسی یک کسب و کار است، به شکلی که با حذف یکی از این پایه‌ها، شاید ماهیت آن کسب و کار تغییر یابد. به بیان دیگر هر انبار داده ، داده‌های مرتبط با یک موضوع خاص را نگهداری می کند که این داد‌ه‌ها جهت استخراج تحلیل‌های خاص به کار گرفته می ‎شوند.

یکپارچه (Integrated)

باید تمامی کدهایی که در سیستم‌های عملیاتی وجود دارند و معانی یکسانی دارند، برای مثال کد جنسیت، در Data warehouse به یک روش ذخیره و نمایش داده شوند. با توجه به اینکه داده‌ها از سیستم‌ها و منابع مختلف جمع‎اوری می‌گردند تکنیک های مختلف عملیات یکپارچه‌سازی و تجمیع داده‌ها به منظور تامین یکپارچگی داده به کار گرفته می‌شود.

زمانگرا (Time Variant)

هر رکورد باید حاوی فیلد و یا کلیدی باشد که نمایانگر این باشد که این رکورد در چه زمانی ایجاد، استخراج و ذخیره شده است. از آنجا که داده‌های درون سیستم‌های عملیاتی آخرین و به روز‌ترین داده هر سیستم می‌باشد، نیازی به وجود چنین عنصری در سیستم‌های OLTP احساس نمی‌گردد، ولی چون در DW تمام داده‌های نسخ قدیمی داده‌های سیستم‌های عملیاتی موجود می‌باشد، باید حتماً مشخص گردد که هر داده‌ای در سیستم‌های عملیاتی در چه زمانی، چه مقادیری داشته است.

ساختار انبار داده:

ساختار ذخیره سازی انبار داده از دو نوع جدول Fact و Dimension است. Dimension‌ها، جدول‌هایی حاوی اطلاعات توصیفی هستند. اطلاعات توصیفی داده‌های مانند نام مشتری، عنوان شغل، نام شرکت و حتی اطلاعات جغرافیایی محل سکونت مشتری می‌باشند. هر جدول Dimension حاوی فهرستی از فیلدها است که به آن‌ها مشخصه (Attribute) می‌گویند. هر مشخصه حاوی اطلاعات توصیفی است و مشخصه‌هایی که به یکدیگر مرتبط هستند در یک Dimension قرار می‌گیرند.
Fact جدولی حاوی فیلدهایی از نوع Measure و تعدادی Foreign Key است که به جداولی از نوع Dimension اشاره می‌کند. جدول‌های Fact معمولاً تعداد زیادی از رکوردها را در خود ذخیره می‌کنند. اغلب فضای انبار داده‌ – چیزی در حدود ۸۰ درصد – را به خود اختصاص می‌دهند.

 

انبار داده در پروژه های هوش تجاری

 

اگر می خواهید اطلاعات بیشتری در این حوزه کسب کنید پیشنهاد می کنیم مقاله آموزش هوش تجاری مطالعه نمایید.

چه رتبه ای می‌دهید؟

میانگین ۴.۳ / ۵. از مجموع ۸

اولین نفر باش

title sign
برچسب ها
title sign
دانلود ویدئو
نقش انباره داده در پروژه‌ های هوش تجاری
فرمت MP4
زمان ویدئو 13 دقیقه
حجم 19 مگابایت
دانلود ویدئو
title sign
معرفی نویسنده
مقالات
21 مقاله توسط این نویسنده
محصولات
65 دوره توسط این نویسنده

مسعود طاهری مدرس و مشاور ارشد SQL Server & BI ،  مدیر فنی پروژه‌های هوش تجاری (بیمه سامان، اوقاف، جین وست، هلدینگ ماهان و...) ، مدرس دوره‌هــای SQL Server و هوش‌تجاری در شرکت نیک‌آموز و نویسنده کتاب PolyBase در SQL Server

title sign
معرفی محصول
title sign
ویدیوهای مرتبط
title sign
دیدگاه کاربران

    • بسیار عالی و مفید مثل همیشه
      با تشکر

      ۱
    • بسیار عالی و مفید مثل همیشه

      ۱