Change Data Capture یا CDC چیست؟

Change Data Capture یا CDC چیست؟

نوشته شده توسط: علیرضا ارومند
تاریخ انتشار: ۰۲ خرداد ۱۳۹۴
آخرین بروزرسانی: 23 دی 1403
زمان مطالعه: 5 دقیقه
۳.۳
(۷)

مفهوم CDC ،یکی از قابلیت های ویژه SQL Server Enterprise Edition (که البته درنسخه‌های Developer و editions هم به خوبی کار می‌کند ) است که روی جدولی در دیتابیس ما فعال می‌شود و تغییرات ناشی از دستورات DML (Insert,Update,Delete) آن را نگهداری می‌کند و ما میتوانیم از این اطلاعات استفاده کنیم. وقتی که ما CDC را روی جدولی فعال میکنیم، SQL Server جدولی مشابه آن به همرای یکسری Metadata ایجاد می‌کند وتغییرات را در آن ذخیره مینماید. در کنار آن تعدادی Table-valued function در اختیار ما قرار میگیرند که به ما امکان استفاده از داده های ذخیره شده را می‌دهند.

مفهوم CDC

هنگامی که CDC روی یک جدول فعال میشود، SQL Server از مکانیزم نامتقارنی (Async) استفاده می‌کند که به کمک آن تغییرات رخ داده در جداول را از فایل log می‌خواند و درجداولی که به منظور نگهداری تغییرات ایجاد کرده ذخیره میکند. در فایل‌های log هر رکوردی که‌ذخیره میشود یک شناسه یکتا با نام Log Sequence Number دارد که به اختصار LSN نامیده می‌شود.بسیاری از Metadataهایی که برای ما نگهداری می‌شود به خاطر قرابت نزدیکی که اینتکنولوژی با Log دارد از همین اطلاعات Log استخراج می‌شوند.

فعال سازی مفهوم CDC

 برای فعال سازی CDC روی یک جدول ابتدا به کمک دستور sys.sp_cdc_enable_db باید آنرا در پایگاهداده مورد نظر فعال کنیم. با اجرای این دستور سیستم CDC بر روی پایگاهداده ما فعال می‌شود و زیرساخت‌های مورد نیاز آن مانند meta-data table ها، CDC Schema ، CDC Database User و … روی پایگاه داده ما ایجاد می‌شوند.  در صورتی که نیاز داشته باشید می‌توانید در sys.databases  و به کمک ستون is_cdc_enabled بررسی کنید که آیا CDC برای دیتابیسشما فعال است یا خیر.حالا شما میتوانید ازدستور sys.sp_cdc_enable_table برای فعال کردن CDC روی جدول خود استفاده کنید. با بررسی ستون is_tracked_by_cdc در sys.tablesمیتوانید از فعال بودن یا نبودن  CDC روی جدول خود مطلع شوید.
با فعال شدن این امکان، با هر تغییری در داده های جدول موردنظر شما، تغییرات آن در جدول CDC متناظر از Log استخراج شده و ذخیره می گردد. به صورت پیش فرض تمامی ستون‌های جدول نگهداری می‌شوند اما در صورت نیاز مثلا به دلایل امنیتی یا Performance شما می‌توانید تنها اطلاعات بعضی از ستون‌های جدول را نگهداری کنید. این کار را به کمک پارامتر @captured_column_list هنگام ایجاد CDC روی جدول انجام میدهیم. همچنین به صورت پیش فرض این اطلاعات روی FileGroup اصلی ما نگهداری می‌شوند که باز هم در صورت نیاز میتوانید با استفاده از پارامتر @filegroup_name یک FileGroup دیگر را جهت نگهداری اطلاعات معرفی کنید.
 فعال بودن SQL Server Agent برای فعال کردن این امکان اجباری نیست. اما فعال بودن آن برای کارکرد صحیح CDC لازم است. به همین منظور در صورتی که هنگام فعال کردن این امکان روی جدول اگر این SQL Server Agent استارت نباشد، با اینکه کار فعال سازی درست انجام می‌شود اما به شما پیامی مبنی بر عدم کارکرد صحیح سیستم داده می‌شود.

آیا جدول CDC بسیار بزرگ می‌شود؟

با توجه به اینکه هر تغییراتی که در جداول ما اتفاق می افتددر جدول CDC نگهداری میشود، احتمالا باید این سوال برای شما پیش آمده باشد کهآیا این جدول بسیار بزرگ نمیشود؟! پاسخ این است خیر. یک روال سیستمی وجود دارد که به صورت اتوماتیک هر ۳ روزیکبار داده ها قدیمی را پاک میکند. البته میتوانید این اندازه را به هر اندازه ایکه نیاز دارید تغییر دهید و یا میتوانید به کمک روال ذخیره شده  sys.sp_cdc_cleanup_change_table این کار را به صورت دستی انجام دهید.

در صورت تغییر در جدولی که تغییرات آن را نگهداری می‌کنیم چه‌ اتفاقی می‌افتد؟

با تغییر در ساختار جدول روال CDC به کار خودادامه میدهد، با این تفاوت که در صورتی که ستونی اضافه شود، دیگر تغییرات آننگهداری نمی شود، و اگر ستونی هم حذف شود مقدار NULL برای آننگهداری می شود. یعنی CDC توجهی به تغییرات اتفاق افتاده ندارد و کار خود را به همان شکلسابق ادامه می دهد. در صورت نیاز شما میتوانید یک روال دیگر برای نگهداری تغییراتستون های جدید ایجاد کنید. اما به خاطر داشته باشید که تنها ۲ نمونه از نگهداری سابقه  را میتوانید برای یک جدول فعال کنیم.

سخن پایانی

در این مطلب، شرح کلی از CDC و نحوه فعالسازی آن را بر روی یک جدول داشتیم. در قسمت بعد با جزئیات این قابلیت جدید و نحوهاستفاده از آن بیشتر آشنا می شویم. ما در نیک آموز منتظر نظرات ارزشمند شما درباره این مقاله هستیم.
 

چه رتبه ای می‌دهید؟

میانگین ۳.۳ / ۵. از مجموع ۷

اولین نفر باش

title sign
دانلود مقاله
Change Data Capture یا CDC چیست؟
فرمت PDF
2 صفحه
حجم 1 مگابایت
دانلود مقاله
title sign
معرفی نویسنده
علیرضا ارومند
مقالات
23 مقاله توسط این نویسنده
محصولات
43 دوره توسط این نویسنده
علیرضا ارومند

علیرضا ارومند به عنوان Product Manager شرکت داتین (وابسته به فناپ) در حوزه پروژه‌های بانکی فعال است.او همچنین مدرس و Technical Manager پروژه‌های نیک آموز می باشد از دیگر تخصص های او میتوان به: تولید فریمورک برنامه نویسی فوق العاده حرفه‌ای با مدیریت بیش از 1 میلیون تراکنش در ثانیه، همکاری با تیم توسعه شرکت ارتباط فردا (بانک آینده)، مشاور فنی شرکت توسعه رفاه پردیس (بانک رفاه)، مدیر فنی خبرگزاری نسیم، سخنران تنها همایش مورد تایید مایکروسافت در خاورمیانه در حوزه ASP.NET Core، مدیر فنی خبرگزاری بین المللی پیام‌کوتاه نسیم (برنده جشنواره وب ایران)، مدرس دوره های Dot Net ، ASP.NET در نیک آموز، همکاری با تیم توسعه شرکت ارتباط فردا

title sign
دیدگاه کاربران

    •  سلام مقاله شما برای آشنایی با CDC عالی است

      اگر بتوانید به شکل کاربردی یک مثال را هم پیاده سازی کنید خیلی عالی می شود
      موفق باشید
    •  سلام

      آموزش کاربردی و قسمت بعدی CDC را چه موقع ارائه می دهید؟ و با وجودیکه 
      In-Memory OLTP از cdc پشتیبانی نمیکند آیا راهکار بهتری برای اینگونه جداول با کمترین هزینه کاری برای سرور پیشنهاد میکنید؟

      پاینده باشید.
      •  با سلام

        فرشید جان بله متاسفانه پشتیبانی نمیشه 
        مجبور هستیم از روش های کلاسیک مثل 
        ۱- تریگر
        ۲- کد نویسی در APP 
        ۳- ,…
        استفاده کنیم. 
        البته بایسد منتظر باشیم ببینیم در SQL Server 2016 آیا قابلیت استفاده از Temporal Database برای این نوع جداول پشتیبانی خواهد شد و یا خیر (احتمالا باید این مورد جزء درخواست های کاربران بوده و کاربران برای آن رای جمع آوری کنند)
        امسال بعد از Release یکسری درخواست را برای SQL Server 2016 مثل کاربران کشورهای دیگه استارت خواهیم زد. ان شااله  تا به کمک اعضاء محترم سایت بتونیم رای جمع آوری کنیم 
        موفق باشید
    •  آیا باید به ازای تک تک کاربران یوزری در اس کیو ال سرور به صورت کامل ایجاد کنیم ؟ 

      یکی از راه ها همین روشی است که شما اشاره کردید به این نوع فیلدها اصطلاحا Audit Field می گوییم.
      که عموما به صورت D-Normal در جداول اعمال می گردد. مانند (کاربری که رکورد را درج کرده * آخرین کاربری که رکورد را ویرایش کرده * تاریخ درج رکورد* آخرین تاریخ ویرایش رکورد * آی پی کاربر درج کننده رکورد * آی پی کاربر درج کننده رکورد و…)

      یا اینکه می تونیم با یک یوزر و پسورد که در اس کیو ال ایجاد شده برای هر کاربری به صورت مجزا مشخص کنیم چه فردی تغییرات CRUD را انجام داده است ؟
      این روش را هم می توانید استفاده کنید در این حالت لازم از Database Audit Specification استفاده کنید 
  • 1
  • 2
هر روز یک ایمیل، هر روز یک درس
آموزش SQL Server بصورت رایگان
همین حالا فرم زیر را تکمیل کنید
دانلود رایگان جلسه اول
نیک آموز علاوه بر آموزش، پروژه‌های بزرگ در حوزه هوش تجاری و دیتا انجام می‌دهد.
close-link
close-image