Change Data Capture یا CDC چیست ؟
یکی از قابلیت های ویژه SQL Server Enterprise Edition (که البته درنسخه های Developer و editions هم بهخوبی کار میکند ) است که روی جدولی در دیتابیس ما فعال میشود و تغییرات ناشی از دستورات DML (Insert,Update,Delete) آن را نگهداریمیکند و ما میتوانیم از این اطلاعات استفاده کنیم. وقتی که ما cdc را روی جدولیفعال میکنیم، SQL Server جدولی مشابه آن به همرای یکسری Metadata ایجاد میکند وتغییرات را در آن ذخیره مینماید. در کنار آن تعدادی Table-valued function در اختیار ما قرار میگیرند که بهما امکان استفاده از داده های ذخیره شده را می دهند.
CDC چگونه کار میکند؟
هنگامی که CDC روی یک جدول فعال میشود، SQL Server از مکانیزم نامتقارنی (Async) استفاده میکندکه به کمک آن تغییرات رخ داده در جداول را از فایل log میخواند و درجداولی که به منظور نگهداری تغییرات ایجاد کرده ذخیره میکند. در فایلهای log هر رکوردی کهذخیره میشود یک شناسه یکتا با نام Log Sequence Number دارد که به اختصار LSN نامیده میشود.بسیاری از Metadataهایی که برای ما نگهداری میشود به خاطر قرابت نزدیکی که اینتکنولوژی با Log دارد از همین اطلاعات Log استخراج می شوند.
برای فعال سازی CDC روی یک جدول ابتدا به کمک دستور sys.sp_cdc_enable_db باید آنرا در پایگاهداده مورد نظر فعال کنیم. با اجرای این دستور سیستم CDC بر روی پایگاهداده ما فعال میشود و زیرساخت های مورد نیاز آن مانند meta-data table ها، CDC schema ، CDC database user و … روی پایگاه داده ما ایجادمیشوند. در صورتی که نیاز داشتهباشید میتوانید در sys.databases و به کمک ستون is_cdc_enabled بررسی کنید که آیا CDC برای دیتابیسشما فعال است یا خیر.
حالا شما میتوانید ازدستور sys.sp_cdc_enable_table برای فعال کردن CDC روی جدول خود استفادهکنید. با بررسی ستون is_tracked_by_cdc در sys.tablesمیتوانید از فعال بودن یا نبودن CDC روی جدول خود مطلع شوید.
با فعال شدن این امکان، با هر تغییری در داده های جدول موردنظر شما، تغییرات آن در جدول CDC متناظر از Log استخراج شده و ذخیره می گردد. به صورت پیش فرض تمامی ستون هایجدول نگهداری میشوند اما در صورت نیاز مثلا به دلایل امنیتی یا پرفورمنسی شمامیتوانید تنها اطلاعات بعضی از ستون های جدول را نگهداری کنید. این کار را به کمکپارامتر @captured_column_list هنگام ایجاد CDC روی جدول انجام میدهیم. همچنین بهصورت پیش فرض این اطلاعات روی FileGroup اصلی ما نگهداری میشوند که باز هم در صورت نیاز میتوانید بااستفاده از پارامتر @filegroup_name یک FileGroup دیگر را جهت نگهداری اطلاعات معرفی کنید.
فعال بودن SQL Server Agent برای فعال کردن این امکان اجبارینیست. اما فعال بودن آن برای کارکرد صحیح CDC لازم است. به همین منظور در صورتی که هنگام فعال کردن این امکانروی جدول اگر این SQL Server Agent استارت نباشد، با اینکه کار فعالسازی درست انجام میشود اما به شما پیامی مبنی بر عدم کارکرد صحیح سیستم داده میشود.
آیا جدول CDC بسیار بزرگ میشود؟
با توجه به اینکه هر تغییراتی که در جداول ما اتفاق می افتددر جدول CDC نگهداری میشود، احتمالا باید این سوال برای شما پیش آمده باشد کهآیا این جدول بسیار بزرگ نمیشود؟! پاسخ این است خیر.
یک روال سیستمی وجود دارد که به صورت اتوماتیک هر 3 روزیکبار داده ها قدیمی را پاک میکند. البته میتوانید این اندازه را به هر اندازه ایکه نیاز دارید تغییر دهید و یا میتوانید به کمک روال ذخیره شده sys.sp_cdc_cleanup_change_table این کار را بهصورت دستی انجام دهید.
در صورت تغییر در جدولی که تغییرات آن را نگهداری میکنیم چهاتفاقی می افتد؟
با تغییر در ساختار جدول روال CDC به کار خودادامه میدهد، با این تفاوت که در صورتی که ستونی اضافه شود، دیگر تغییرات آننگهداری نمی شود، و اگر ستونی هم حذف شود مقدار NULL برای آننگهداری می شود. یعنی CDC توجهی به تغییرات اتفاق افتاده ندارد و کار خود را به همان شکلسابق ادامه می دهد. در صورت نیاز شما میتوانید یک روال دیگر برای نگهداری تغییراتستون های جدید ایجاد کنید. اما به خاطر داشته باشید که تنها 2 نمونه از نگهداریسابقه را میتوانید برای یک جدولفعال کنیم.
خلاصه: در این مطلب، شرح کلی از CDC و نحوه فعالسازی آن را بر روی یک جدول داشتیم. در قسمت بعد با جزئیات این قابلیت جدید و نحوهاستفاده از آن بیشتر آشنا می شویم.
همچنین شما می توانید پادکست صوتی رادیو نیک آموز: نحوه نگهداری History (تاریخچه) تغییرات Data بشونید.
منبع: آموزش برنامه نویسی – نیک آموز
16 دیدگاه
فرشید علی اکبری
سلام
مسعود طاهری
با سلام
مسعود طاهری
سلام مقاله شما برای آشنایی با CDC عالی است
محمدحسین عبدالهی
تشکر می کنم
سوال : برای اینکه مشخص بشه چه کاربری تغییرات رو در جدول داده به چه صورت باید عمل کنیم؟
آیا باید به ازای تک تک کاربران یوزری در اس کیو ال سرور به صورت کامل ایجاد کنیم ؟
یا اینکه می تونیم با یک یوزر و پسورد که در اس کیو ال ایجاد شده برای هر کاربری به صورت مجزا مشخص کنیم چه فردی تغییرات CRUD را انجام داده است ؟
مسعود طاهری
آیا باید به ازای تک تک کاربران یوزری در اس کیو ال سرور به صورت کامل ایجاد کنیم ؟
مرجان آب بر
با سلام و تشکر فراوان
من چند ماه پیش روی این قضیه کار کردم تا بتوانم از cdc برای ذخیره تغییرات انجام شده توسط هر کاربر در برنامه ام استفاده کنم اما تا جایی که یادم هست مشکل عمده این بود مشخص نمیشد کدام کاربر این تغییرات را اعمال کرده است .
با وجود ساختن یوزر جداگانه در اس کیو ال برای هر کاربر و لاگین کردن با این یوزر به اس کیو ال اما sql server aqent باز کاربر فعلی را همان یوزر ادمین ذخیره میکرد. و متاسفانه به نتیجه ای نرسیدم ممنون میشم اگه کسی راهنمایی نماید.
مسعود طاهری
سلام
فرشید علی اکبری
سلام مهندس طاهری عزیز
میخواستم بدونم در بانکهای اطلاعاتی بزرگ که
بالای 150 جدول اطلاعاتی دارند (منظورم اینه که کل مجموعه نرم افزارها شامل سیستم های
مختلف از یک دیتابیس تغذیه میشوند ولی با استفاده از گروه بندی های مختلف و شماها
و سطح دسترسی های مختلف جداسازی شده اند) چنانچه در چنین بانک اطلاعاتی CDC را (برای اطلاعات پایه
گرفته تا کلیه فرمهای عملیاتی) راه اندازی
کنیم آیا مشکلی برای Performance سرور پیش نمی آید؟ البته
در شرایطی که job های مربوطه را روی 60 روز
برای حذف سوابق تنظیم کنیم و تعداد کاربران شبکه حداقل 10 نفر باشند آیا برای سرور
شبکه هزینه بر است و یا اینکار فقط برای فاکتورها- رسیده- اسناد- کدینگ وامثال این
موارد پیاده سازی شود؟ آیا بالاخره در نسخه 2016 ما امکان استفاده از cdc برای جداول In-Memory OLTP را خواهیم داشت؟
از اینکه سئوالم طولانی شد عذرخواهی میکنم.
با سپاس فراوان
مجتبی شهریور
سلام
ضمن تشکر از مقاله خوبتون سئوالی برام پیش اومد و اون اینکه می خواستم بدونم اتفاقاتی که برای نگهداری در جدول رخ می دهد (بق بند آخر مقاله) منظور جول اصلی بانک اطاعاتی می باشد؟؟؟؟
جواد
سلام خسته نباشید
خیلی ممنون بابت مطلبی که بهش پرداخته اید
من از CDC استفاده کردم و Backup از دیتابیس گرفتم وقتی که دیتابیس رو Restore کردم تمام اطلاعات جداول CDC حذف شده اند و دیگر تغییرات را ذخیره نمی کند
با تشکر
مسعود طاهری
سلام
جواد
خیلی ممنون بابت راهنماییتون
این کارو کردم ولی نه اطلاعات برگشت نه دیگه تغییرات را ثبت میکنه
موقع Backup گرفتن هم باید از Keep_CDC استفاده کنم؟
مسعود طاهری
1- آیا CDC الان روی دیتابیس اصلی فعال است ؟
جواد
درست شد خیلی خیلی ممنون
سایت بسیار خوبی دارید خسته نباشید
m
سلام خوب بود فقط سعی کنید برای افرادی که از Express هم استفاده می کنند راه کار های جدید ارائه بدید من در حال حاضر از تریگر ها استفاده می کنم اگه لطف کنید راهکارهای جدیدتر در این زمینه ارائه بدید ممنون میشم تمام برنامه ها که نیاز به دیتابیس های بزرگ ندارند میشه از express استفاده کرد در ضمن دوره هایی مثل linked server را هم اگه لطف کنید ادامه بدید خیلی خوب میشه
مسعود طاهری
یکی از راه های ساده جمع آوری لاگ تغییرات استفاده از تریگر است . یا اینکه در خود Application از این کار را انجام دهید. (لایه DAL)