حل مشکل تخمین Cardinality با استفاده از Filtered Statistics

نوشته شده توسط: تورج عزیزی

تاریخ انتشار: ۱۲ تیر ۱۳۹۵

آخرین بروزرسانی: 29 بهمن 1403

زمان مطالعه: 10 دقیقه

در این مقاله تاثیر Filtered Statistics، را بر روی Performance خواهید دید. از SQL Server 2008 به بعد، Filtered Statistics به عنوان یک قابلیت اضافه شد. با استفاده از Filtered Statistics می توان روی زیر مجموعه ای از دیتای کلی یک جدول شیء آمار ساخت. تاثیر Filtered Statistics به این دلیل می تواند خیلی موثر واقع شود: قسمت Histogram در Statistics محدودیت ۲۰۰ طبقه ای را دارد و این به خاطر این است که اطلاعات شیء آمار باید در حداکثر یک Page جا شود.

تاثیر Filtered Statistics

اما Filtered Statistics این امکان را فراهم می کند که بتوان روی زیر مجوعه ای از دیتای یک جدول آمار ساخت و البته چون رکوردهای کمتری نسبته به کل جدول داریم آمار دقیق تری خواهیم داشت. و در نتیجه تخمین Cardinality توسط Query Optimizer بهتر انجام می شود به این معنی که پلن بهتری خواهیم داشت و در نهایت سرعت بهتری!
مثال

 CREATE STATISTICS Country_Austria ON Country(ID)
WHERE Name = 'Austria'
GO

و مهمتر اینکه Query Optimizer فقط وقتی همان شرط بالا در یک کوئری بیاید از این شیء آمار و در غیر این صورت از آمار پیش فرض استفاده می کند:

SELECT SalesAmount FROM Country
INNER JOIN Orders ON Country.ID = Orders.ID
WHERE Name = 'Austria'
GO

مشاهده کامل‌ترین و بروزترین آموزش sql server در نیک آموز

آزمایش تاثیر Filtered Statistics بر Performance

کد های زیر را برای تولید دیتای آزمایشی اجرا کنید:

-- Create a new database
CREATE DATABASE FilteredStatistics
GO
-- Use it
USE FilteredStatistics
GO
-- Create a new table
CREATE TABLE Country
(
ID INT PRIMARY KEY,
Name VARCHAR(100)
)
GO
-- Create a new table
CREATE TABLE Orders
(
ID INT,
SalesAmount DECIMAL(18, 2)
)
GO

ساخت ایندکس

 -- Create a Non-Clustered Index
CREATE NONCLUSTERED INDEX idx_Name ON Country(Name)
GO
-- Create a Clustered Index
CREATE CLUSTERED INDEX idx_ID_SalesAmount ON Orders(ID, SalesAmount)
GO

درج دیتا

 -- Insert a few records into the Lookup Table
INSERT INTO Country VALUES(0, 'Austria')
INSERT INTO Country VALUES(1, 'UK')
INSERT INTO Country VALUES(2, 'France')
GO
-- Insert uneven distributed order data
INSERT INTO Orders VALUES(0, 0)
DECLARE @i INT = 1
WHILE @i <= 1000
BEGIN
INSERT INTO Orders VALUES (1, @i)
SET @i += 1
END
GO

حصول اطمینان از بروز بودن آمار

 -- Update the Statistics on both tables
UPDATE STATISTICS Country WITH FULLSCAN
UPDATE STATISTICS Orders WITH FULLSCAN
GO

کوئری تستی

SELECT SalesAmount FROM Country
INNER JOIN Orders ON Country.ID = Orders.ID
WHERE Name = 'UK'
OPTION
(
RECOMPILE,-- Used to see the Statistics Output
QUERYTRACEON 3604,-- Redirects the output to SSMS
QUERYTRACEON 9204-- Returns the Statistics that were used during Cardinality Estimation ("Stats loaded")
)
GO

وقتی به پلن اجرا نگاه می کنیم متوجه یک مشکل بزرگ در تخمین Cardinality می شویم:تخمین SQL Server به تعداد ۵۰۱ ردیف است و در واقعیت ۱۰۰۰ ردیف برگشت داده شده است. پایگاه داده SQL Server با مراجعه به Density Vector آمار ایندکس idx_ID_SalesAmount محاسبه را انجام داده: چون فقط ۲ مقدار یونیک داریم پس Density Vector برابر با ۰.۵ می شود و ۱۰۰۱ * ۰.۵ = 501.
وقتی همان کوئری را به شرط Austria اجرا کنیم، باز هم تخمین برابر ۵۰۱ است و کوئری ۱ رکورد بر می گرداند. این تخمین اشتباه تاثیر بدی در پلن اجرا دارد چون درخواست حافظه برای اجرا توسط هر عملگر در پلن اجرا و انتخاب نوع عملگر مستقیماً با توجه به تعداد ورودی های آن عملگر صورت می گیرد. شما می‌توانید کوئری نویسی را به صورت گام‌به‌گام از نیک آموز فرا بگیرید. در چنین سناریوی خاصی می توانید با Filtered Statistics به تخمین کمک کنید:

 -- Fix the problem by creating Filtered Statistics Objects
CREATE STATISTICS Country_UK ON Country(ID)
WHERE Name = 'UK'
CREATE STATISTICS Country_Austria ON Country(ID)
WHERE Name = 'Austria'
GO

با اجرای مجدد کوئری

سخن پایانی

با ایجاد تاثیر Filtered Statistics همه چیز تمام نمی شود. باید حواستان به نگهداری از آمار باشد چون SQL Server با تغییر ۲۰% از دیتای شما آمار را بروز می کند. یعنی اگر جدولی با ۱۰۰۰۰ رکورد داشته باشید باید ۲۰۰۰ تغییر در جدول اتفاق بیفتد تا آمار شما اعم از Filtered Statistics یا عادی بروز شود. ما در نیک آموز منتظر نظرات ارزشمند شما درباره این مقاله هستیم.

معرفی نویسنده

مقالات

18 مقاله توسط این نویسنده

محصولات

0 دوره توسط این نویسنده

تورج عزیزی

معرفی محصول

مسعود طاهری

دوره ۳ در ۱ آموزش performance tuning در SQL Server

6.700.000 تومان

مقالات مرتبط

۰۲ آبان

SQL Server

ابزار Database Engine Tuning Advisor

تیم فنی نیک آموز

۱۵ مهر

SQL Server

معرفی Performance Monitor ابزار مانیتورینگ SQL Server

تیم فنی نیک آموز

۱۱ مهر

SQL Server

راهنمای جامع مانیتورینگ بکاپ ها در SQL Server

تیم فنی نیک آموز

Resource Governor چیست؟ آشنایی با نحوه پیکربندی و اهمیت های آن

۰۸ مهر

SQL Server

Resource Governor چیست؟ آشنایی با نحوه پیکربندی و اهمیت های آن

تیم فنی نیک آموز

دیدگاه کاربران

لغو پاسخ

دیدگاه

نام و نام خانوادگی

ایمیل

موبایل

برای اطلاع از پاسخ لطفاً مرا با خبر کن

مصطفي زماني
۲۴ / ۰۴ / ۹۵ - ۰۹:۰۵

سلام

با تشکر از مقاله سودمند شما

به نظر می‌رسد به‌روز نگه داشتن آمار کار مشکلی است. به ویژه در شرایطی که تعداد رکوردهای جدول بالا باشد و تغییرات پارامتر ورودی نیز متعدد است.
فرشید علی اکبری
۲۱ / ۰۴ / ۹۵ - ۰۱:۴۸

سلام

مطلب بسیار مفید وکاربردی خوبی بود.

تشکر.
تورج عزیزی
۱۵ / ۰۴ / ۹۵ - ۰۷:۵۳

سلام
توی مقالات پیش نیاز توضیح دادم
منظور selectivity اون ستونی که آمار به ازای اون ساخته شده است که به شکل ۱ تقسیم بر تعداد مقادیر یونیک تعریف میشه و Optimizer با این مقدار می تونه بفهمه که چند درصد از رکوردهای جدول یک شرط با مقدار بخصوص (مقداری از مقادیر این ستون) رو ارضا می کنه.
Hope this helps.
seyedmahdi
۱۴ / ۰۴ / ۹۵ - ۱۱:۰۵

با سلام و تشکر از مقاله خوبتون
من منظورتونو از density vector متوجه نشدم میشه کمی بیشتر توضیح بدید؟
m.abbasi.72@gmail.com
۱۳ / ۰۴ / ۹۵ - ۰۱:۳۰

بسیار عالی. دنبال این مقاله میگشتم.
مشکل من مرتفع شد

حل مشکل تخمین Cardinality با استفاده از Filtered Statistics

تاثیر Filtered Statistics

آزمایش تاثیر Filtered Statistics بر Performance

ساخت ایندکس

درج دیتا

حصول اطمینان از بروز بودن آمار

کوئری تستی

با اجرای مجدد کوئری

سخن پایانی

دوره ۳ در ۱ آموزش performance tuning در SQL Server

ابزار Database Engine Tuning Advisor

معرفی Performance Monitor ابزار مانیتورینگ SQL Server

راهنمای جامع مانیتورینگ بکاپ ها در SQL Server

Resource Governor چیست؟ آشنایی با نحوه پیکربندی و اهمیت های آن

لغو پاسخ

مصطفي زماني

فرشید علی اکبری

تورج عزیزی

seyedmahdi

m.abbasi.72@gmail.com

پاپ آپ | SQL Server