نقش انباره داده در پروژه‌ های هوش تجاری

۴
(۶)

انبار داده  یا Data Warehouse به مجموعه‌ای از داده‌ها گفته می‌شود که از منابع مختلف اطلاعاتی سازمان جمع‌آوری، دسته‌بندی و ذخیره می‌شود. پایگاه داده‌ای که برای گزارش‌گیری و تحلیل داده به کار می‌رود و به عنوان هسته اصلی یک سیستم هوش‌ تجاری به شمار می‌آید. از آن به عنوان قلب تپنده پروژه‌های هوش تجاری نام می‌برند. و ساختار آن به شکل D-Normal است. انبار داده به شکل کاملا مستقل نسبت به سایر بانک‌های اطلاعاتی ایجاد و طراحی گردد. و با پروسه‌ای به نام (Extract Transform and Load) که به معنای استخراج، پالایش و بارگذاری اطلاعات می‌باشد، اطلاعات و داده‌ها به انبار داده منتقل می‌شود.

ویژگی‌های انباره داده:

داده‌های انبار داده از نگاه Inmon دارای ۴ ویژگی اصلی زیر هستند:
غیرفرار و ماندگار(Non-Volatile) هیچ رکوردی و یا داده‌ای Update نخواهد شد و صرفاً رکوردهایی که محتوای مقادیر جدید داده‌ها هستند، به سیستم اضافه خواهند شد.

موضوع گرا (Subject-Oriented)

منظور از “موضوع” پایه‌های اساسی یک کسب و کار است، به شکلی که با حذف یکی از این پایه‌ها، شاید ماهیت آن کسب و کار تغییر یابد. به بیان دیگر هر انبار داده ، داده‌های مرتبط با یک موضوع خاص را نگهداری می کند که این داد‌ه‌ها جهت استخراج تحلیل‌های خاص به کار گرفته می ‎شوند.

یکپارچه (Integrated)

باید تمامی کدهایی که در سیستم‌های عملیاتی وجود دارند و معانی یکسانی دارند، برای مثال کد جنسیت، در Datawarehouse به یک روش ذخیره و نمایش داده شوند. با توجه به اینکه داده‌ها از سیستم‌ها و منابع مختلف جمع‎اوری می‌گردند تکنیک های مختلف عملیات یکپارچه‌سازی و تجمیع داده‌ها به منظور تامین یکپارچگی داده به کار گرفته می‌شود.

زمانگرا (Time Variant)

هر رکورد باید حاوی فیلد و یا کلیدی باشد که نمایانگر این باشد که این رکورد در چه زمانی ایجاد، استخراج و ذخیره شده است. از آنجا که داده‌های درون سیستم‌های عملیاتی آخرین و به روز‌ترین داده هر سیستم می‌باشد، نیازی به وجود چنین عنصری در سیستم‌های OLTP احساس نمی‌گردد، ولی چون در DW تمام داده‌های نسخ قدیمی داده‌های سیستم‌های عملیاتی موجود می‌باشد، باید حتماً مشخص گردد که هر داده‌ای در سیستم‌های عملیاتی در چه زمانی، چه مقادیری داشته است.

ساختار انبار داده:

ساختار ذخیره سازی انبار داده از دو نوع جدول Fact و Dimenstion است. Dimension‌ها، جدول‌هایی حاوی اطلاعات توصیفی هستند. اطلاعات توصیفی داده‌های مانند نام مشتری، عنوان شغل، نام شرکت و حتی اطلاعات جغرافیایی محل سکونت مشتری می‌باشند. هر جدول Dimension حاوی فهرستی از فیلدها است که به آن‌ها مشخصه (Attribute) می‌گویند. هر مشخصه حاوی اطلاعات توصیفی است و مشخصه‌هایی که به یکدیگر مرتبط هستند در یک Dimension قرار می‌گیرند.
Fact جدولی حاوی فیلدهایی از نوع Measure و تعدادی Foreign Key است که به جداولی از نوع Dimension اشاره می‌کند. جدول‌های Fact معمولاً تعداد زیادی از رکوردها را در خود ذخیره می‌کنند. اغلب فضای انبار داده‌ – چیزی در حدود ۸۰ درصد – را به خود اختصاص می‌دهند.

 

انبار داده در پروژه های هوش تجاری

 

اگر می خواهید اطلاعات بیشتری در این حوزه کسب کنید پیشنهاد می کنیم مقاله آموزش هوش تجاری مطالعه نمایید.

چه رتبه ای می‌دهید؟

میانگین ۴ / ۵. از مجموع ۶

اولین نفر باش

title sign
برچسب ها
title sign
دانلود ویدئو
نقش انباره داده در پروژه‌ های هوش تجاری
فرمت MP4
زمان ویدئو 13 دقیقه
حجم 19 مگابایت
دانلود ویدئو
title sign
معرفی نویسنده
مقالات
30 مقاله توسط این نویسنده
محصولات
47 دوره توسط این نویسنده

مسعود طاهری مدرس و مشاور ارشد SQL Server & BI ،  مدیر فنی پروژه‌های هوش تجاری (بیمه سامان، اوقاف، جین وست، هلدینگ ماهان و...) ، مدرس دوره‌هــای SQL Server و هوش‌تجاری در شرکت نیک‌آموز و نویسنده کتاب PolyBase در SQL Server

title sign
معرفی محصول
مسعود طاهری

دوره جامع آموزش هوش‌ تجاری (گروه 25 و 26)

ثبت نام حضوری9.700.000 تومان
ثبت نام غیرحضوری
6.700.000 تومان4.700.000 تومان
title sign
ویدیوهای مرتبط
۱۸ اردیبهشت

نقش OLAP در پروژه‌های هوش تجاری

16 دقیقه دقیقه
100 مگابایت
۱۱ اردیبهشت

نقش ETL در هوش تجاری

8 دقیقه دقیقه
10 مگابایت
title sign
دیدگاه کاربران