انباره داده یا Data Warehouse چیست؟ [بخش دوم]

انباره داده یا Data Warehouse چیست؟ [بخش دوم]

نوشته شده توسط: احسان حسین پور
۱۳ آذر ۱۳۹۶
زمان مطالعه: 8 دقیقه
۳
(۷)

مقدمه

همانطور که در مقاله قبلی اشاره شد، ساختار ذخیره‌سازی انباره داده‌ها از دو نوع جدول Fact و Dimension است. در ادامه به بررسی انواع مختلف این نوع از جداول می ‌پردازیم.
جداول Dimensionیا بُعد، حاوی اطلاعات توصیفی هستند. اطلاعات توصیفی داده‌هایی مانند نام مشتری، عنوان شغل، نام شرکت و حتی اطلاعات جغرافیایی محل سکونت مشتری می‌باشند. هر جدول Dimension حاوی فهرستی از فیلدها است که به آن‌ها Attribute گفته می‌شود. هر مشخصه حاوی اطلاعات توصیفی است و مشخصه‌هایی که به یکدیگر مرتبط هستند در یک بُعد قرار می‌گیرند. برای مثال، بُعد مشتری حاوی Attribute و یا فیلدهای زیر است.انباره داده یا Data Warehouse چیست؟هر بُعد دارای یک کلید اصلی است که به آن Surrogate Key می‌گویند. کلید اصلی سیستم منبع در جدول بُعد به‌عنوان Business Key ذخیره می‌شود. در واقع Business Key همان کلید اصلی در جداول سیستم‌های OLTP است. در مثال بالا CustomerKey ‌ به عنوان Surrogate Key و CustomerPK به عنوان Bussiness Key‌ به شمار می آید.

دوره انبار داده در هوش تجاری

Fact

Fact جدولی حاوی فیلدهایی از نوع قابل اندازه‌گیری و قابل شمارش و تعدادی Foreign Key است که به جداول Dimension اشاره می‌کند. جدول‌های Fact معمولاً تعداد زیادی از رکوردها را در خود ذخیره می‌کنند. اغلب فضای انبار داده‌ – چیزی در حدود ۸۰ درصد – را به خود اختصاص می‌دهند.
ساختارهایStar Schema ‌ و Snowflake Schema‌ از معروفترین ساختارهای ارتباطی بین جداول انبار داده معمولا به شمار می‌آیند.

مدل ستاره‌ای (Star Schema)

انباره داده یا Data Warehouse چیست؟ [بخش دوم]در این مدل Fact به‌عنوان یک هاب در مرکز قرار می‌گیرد و جداول Dimension از طریق ایجاد کلید خارجی به آن متصل می‌شوند. در این روش تمام صفات قابل شمارش و اندازه‌گیری در جدولFact قرار می‌گیرند. در تصویر بالا در جدول فروش می تواند شامل مبلغ فروش، تعداد فروش، میزان سود باشد.
در این روش زمان اجرا به دلیل ارتباط مستقیم بین جداول Fact ‌ و Dimension و نتیجتا join های کمتر بسیار سریع است.

مدل دانه برفی (Snowflake Schema)

انباره داده یا Data Warehouseهمانطور که در شکل بالا مشخص است، در این مدل Dimensionها نرمال شده اند و افزونگی در این روش کاهش یافته است. بعبارت دیگر فضای ذخیره‌سازی کاهش یافته ولی زمان پاسخگویی به یک کوئری تحلیلی نیازمند joinهای بیشتری است بنابراین زمان پاسخگویی آن نسبت به مدل ستاره‌ای کندتر خواهد بود.

چه رتبه ای می‌دهید؟

میانگین ۳ / ۵. از مجموع ۷

اولین نفر باش

title sign
دانلود مقاله
انباره داده یا Data Warehouse چیست؟ [بخش دوم]
فرمت PDF
3 صفحه
حجم 1 مگابایت
دانلود مقاله
title sign
معرفی نویسنده
احسان حسین پور
مقالات
4 مقاله توسط این نویسنده
محصولات
4 دوره توسط این نویسنده
احسان حسین پور

احسان حسین پور مدیر بانک اطلاعاتی در شرکت پرداخت الکترونیک سداد و همچنین مدرس و مشاور SQL Server در نیک‌آموز است. از دیگر سوابق او به مدیر پایگاه داده در شرکت حصین ، مدیر فنی توسعه سامانه نیکنام، ، متخصص سیستم‌های انبارداده و هوش تجاری، طراحی In-Memory OLTP در SQL Server اشاره کرد.

پروفایل نویسنده
title sign
معرفی محصول
title sign
دیدگاه کاربران

ثبت نام رایگان در همایش Tehran .NET Conf 2023 ، همین الان کلیک کنید
ثبت نام رایگان..
close-image