Bus Matrix در انباره داده

Bus Matrix در انباره داده

نوشته شده توسط: داوود گراوند
تاریخ انتشار: ۰۲ دی ۱۴۰۰
آخرین بروزرسانی: ۲۱ مهر ۱۴۰۱
زمان مطالعه: 8 دقیقه
۴.۳
(۶۸۸)

مقدمه

در شروع یک پروژه هوش تجاری یا انباره داده یک فرایند گام به گام طی می‎شود تا اطلاعات لازم برای طراحی و ساخت بخش‎های مختلف را استخراج کنیم. برنامه ریزی و طرح ریزی پروژه اولین گام خواهد بود، پس از آن مراحل طراحی، توسعه، تست و پیاده سازی را طی خواهیم کرد تا به در نهایت به یک سیستم پایدار و قابل بهره برداری برسیم. مدل های مبتنی برDimension بر اساس فرایندهای تجاری ساخته می‎شوند نه بخش های تجاری، به عنوان مثال به جای اینکه داده های مشتری به ازای هر یک از واحد ها و سیستم های بازاریابی، فروش و امور مالی تکرار شوند یکبار در انباره داده جمع آوری، استاندارد و در دسترس قرار می‎گیرند. Bus Matrix به ما کمک می‎کند روابط بین فرایند های کسب و کار را در قالب Fact ها و Dimensionها کشف کنیم.

چرخه تولید یک پروژه هوش تجاری

چرخه تولید یک پروژه هوش تجاری یا انباره داده را می‎توان به شکل زیر در نظر گرفت:

  • طرح ریزی
    • شناسائی ابعاد و حوزه های پروژه
    • طرح ریزی اولیه
  • جمع آوری نیازها و نیازمندی ها
    • رسیدن به تعاریف مشترک روی عبارات کلیدی و نیازمندی ها
    • انجام مصاحبه ها و گفتگوها / بررسی گزارش ها / مرور سیستم ها و فایل ها / مستندسازی برآورد ها و مطالعات
  • طراحی منطقی
    • طراحی معماری تکنیکال
    • مدل سازی ابعادی پروژه
    • طراحی اولیه مدل و اپلیکیشن BI
  • طراحی فیزیکی
  • توسعه
    • طراحی و توسعه ETL
    • توسعه اپلیکیشن BI
  • تست
  • استقرار
  • پشتیبانی و نگهداری

شما ممکن است مراحل بالا را متفاوت از این چرخه تعریف و اجرا کنید و یا اسامی‎دیگری را برای هر فاز آن انتخاب کنید، اما از نظر تکنیکال تفاوت چندانی نخواهیم داشت. این نکته را در نظر بگیرید که کارهای زیادی زیر سایه هر یک از این عناوین انجام می‎شود و این عبارات تنها به کلیات هر بخش اشاره دارند. دو مستند The Data Warehouse Lifecycle Toolkit و Data Warehouse Toolkit دو منبع اصلی این متن و البته رویکرد اصلی در طراحی خیلی از پروژه های BI هستند و شما می‎توانید با رجوع به آنها اطلاعات بیشتری از هر یک از این بخش ها به دست بیاورید.

Bus Matrix چیست؟

یکی از آیتم های کلیدی و خروجی های مهم در فاز تحلیل و نیازسنجی رویکرد کیمبال Bus Matrix است. Bus Matrix را می‎توان یکی از ابزارهای کمک کننده در طراحی و یکی از مشتقات نهایی پروژه دانست. Bus Matrix را می‎توان یک نمایش کلی و ساده از ابعاد مختلف پروژه در محیط انباره داده یا BI دانست. از آن می‎توان به عنوان یک راهنما برای طراحی منطقی و شیوه ارتباط و انتقال داده ها در معماری کلی کسب و کار استفاده کرد. نتیجه شامل لیست حوزه های مختلف پروژه و ابعاد مرتبط با هر بخش خواهد بود.

برای ایجاد Bus Matrix در ابتدا اطلاعات استخراج شده اولیه را مورد بررسی قرار می‎دهیم. برای شروع، هنگام برگزاری جلسات و گردآوری اطلاعات و مستندات شروع به استخراج کلمات و جملات کلیدی می‎کنیم که می‎توانند حداکثر مزیت را برای ما به همراه داشته باشند و می‎توانند به عنوان یک اهرم اصلی در جهت شناخت ابعاد پروژه به آنها تکیه کنیم. به عنوان مثال، جملاتی مانند، “من باید در مورد فروش، بر اساس زمان، محصول، و مشتری گزارش بدهم” می‎تواند یک نمونه مناسب باشد. بخش اول جمله در جهت شناخت حوزه کسب و کار به ما کمک می‎کند و تمرکز بخش دوم (بر اساس) که مقابل آن قرار دارد بر شناسایی ابعاد است. هر زمان که کلماتی نظیر”بر اساسِ”، “به کمک”، “توسط”، “ذیلِ”، “با استفاده از”، “به وسیله ی” و کلماتی از این دست شنیدید خوشحال باشید که به شناخت مساله نزدیک تر شده اید، آن را یادداشت کنید و در ذهنتان به یک dimension جدید فکر کنید. یادآور می‎شویم که جداول dimension به یک ویژگی یا بعد از پروژه اشاره دارند که جداول Fact را توصیف می‎کنند. ابعاد ترجیحا باید کلی و فراگیر باشند و از ۱ تا n حوزه موضوعی را پشتیبانی کنند. اما چگونه می‎توان به شیوه ای منسجم و واضح به همه ی آنها نگاه کنیم؟ اینجاست که Bus Matrix وارد عمل می‎شود.
تصور زیر مهندسی معکوس Bus Matrix را برای پایگاه داده AdventureWorksDW نشان می‎دهد. این تصویر به شما ایده می‎دهد که ما در مورد چه چیزی صحبت می‎کنیم و چگونه و چه اندازه داشتن چنین ماتریسی می‎تواند در شروع یک پروژه انباره داده کمک کننده باشد.

با استفاده از اکسل، می‎توانید به راحتی شروع به ساختن Bus Matrix کنید، و تا زمانی که باور ندارید تصویر کاملی از آنچه که قرار است ساخته شود دارید، به توسعه و پالایش آن ادامه دهید. Bus Matrix می‎تواند در طول توسعه سیستم کامل و کامل تر شود. طی بررسی من در متون مختلف کلیدواژه هایی که در سطر ها مورد استفاده قرار گرفته اند میتوانند factها، business Processها و یا DataMartها باشند، انتخاب هر یک از این کلیدواژه ها به نوع پروژه شما بستگی خواهد داشت، در خیلی از متون و زمانی که در سطر ها از عناوین DataMart استفاده می‎شود ماتریس حاصل را bus architecture می‎نامند. اساسا این سطر ها نماینده یک بخش از کسب و کاری خواهند بود که شما می‎خواهید در ارتباط با آنها گزارشی را ارائه دهید و سایر اطلاعات شرکت حول آنها خواهند بود و آنها را توضیف خواهند کرد، برایند همه ی تعاریف این پنج کلمه است: “یک فرآیند تجاری مهم و تکرارشونده”. برخی طراحان انباره داده تمامی‎فرایندهای تجاری مهم و تکرارشونده را در قالب سطرها می‎نویسند و درنهایت مانند شکل زیر آنهایی را که تحت مدل Star (یا هر مدل دیگری) انتخاب و توسعه می‎دهند را با یک رنگ پس زمینه متفاوت نشان می‎دهند. فرایند های تجاری باقی مانده هم تحت عنوان پتانسیل های بالقوه شرکت جهت توسعه در پروژه های آتی معرفی می‎شوند.

کلید واژه هایی که در ستون ها مورد استفاده قرار می‎گیرد، dimension های شما خواهند بود، این ماتریس جزء اصلی معماری انبار داده کیمبال است و از آن می‎توان در بحث دسترسی ها، قابلیت استفاده مجدد از داده، ارتباطات پروژه و همچنین تخصیص دیتامارت های مختلف به تیم های مختلف برای توسعه استفاده کرد.
در یک دیدگاه کلان تر، تصویر زیر می‎تواند ارتباط معنادارتری بین نامگذاری bus architecture در محیط انباره داده به شما ارائه دهد.

ماتریس و معماری گذرگاه بر مفهوم Conformed Dimensionها بنا شده است. شناخت و داشتن Conformed Dimensionها برای داشتن یک سیستم گزارش گیری یکدست و منسجم ضروری است، Conformed Dimensionها ابعاد پر استفاده، استاندارد شده و مهمی‎هستند که یک بار استخراج و ETL می‎شوند و سپس توسط جداول FACT مختلف مورد استفاده قرار می‎گیرند. بنابراین سازمانی که از bus architecture برای توسعه انباره داده خود استفاده می‎کند می‎تواند ارتباطات بین فرایندهای بیزینسی(facts) و خصوصیات توصیفی (dimensions) آنها را شناسائی و اجرا کند و با استفاده از bus matrix باعث حذف تلاش‌های اضافی هنگام شناسائی Dim ها در زمان طراحی و توسعه شود و درنتیجه زمان ورود به بازار را کوتاه ‌کند.

در ادامه

حالا که Bus Matrix خود را طراحی کردید برای ادامه ی کار می‎توانید هر سطر و dimension های وابسته به آن را بردارید و شروع به پیشروی و بررسی جزئیات کنید و به شکل عمیق تری آن ها را بررسی کنید. هنگامی‎که جزئیات لازم در مورد حوزه ها و ابعاد موضوعی پروژه را دارید، می‎توانید از آن برای شروع ساخت مدل منطقی داده ها و سپس طراحی مدل فیزیکی و فرآیندهای ETL استفاده کنید.

به یاد داشته باشید که Bus Matrix در یک مرحله خاتمه پیدا نمی‎کند و ایجاد آن یک کار تک مرحله ای نیست، با دریافت اطلاعات جدید برگردید و با توجه به آن اطلاعات ماتریس خورد را تغییر دهید و سعی کنید در طول توسعه پروژه آن را به روز نگه دارید.

چه رتبه ای می‌دهید؟

میانگین ۴.۳ / ۵. از مجموع ۶۸۸

اولین نفر باش

title sign
معرفی نویسنده
داوود گراوند
مقالات
3 مقاله توسط این نویسنده
محصولات
0 دوره توسط این نویسنده
داوود گراوند
پروفایل نویسنده
title sign
معرفی محصول
title sign
دیدگاه کاربران

    • بسیار مفید و کاربردی، با تشکر

    • تشکر میکنم از مطلب خوبتون.
      آقای گراوند عزیز. اگر امکانش بود، در مورد ساخت یک fact فروش، در دیتابیس مثلا Northwind و پر کردن آن به صورت incremental و البته توانایی آپدیت، در SSIS مقاله ای بنویسید.(خلاصه مطلب یک پکیج برای پر کردن fact)
      واقعا ممنونم

    • تشکر میکنم از مطلب خوبتون.
      آقای گراوند عزیز. اگر امکانش بود، در مورد ساخت یک fact فروش، در دیتابیس مثلا Northwind و پر کردن آن به صورت incremental و البته توانایی آپدیت، در SSIS مقاله ای بنویسید.(خلاصه مطلب یک پکیج برای پر کردن fact)
      واقعا ممنونم