سلام دوستان
امروز می خواهم راجع به مشکل بخصوصی که به indexing در SQL Server مربوط می شود صحبت کنم.
تعریف مشکل
نمونه کوئری زیر را در نظر بگیرید، مثل این کوئری را صدها بار در SQL Server دیده اید:
[sql] — Results in an Index Scan
SELECT*FROM Sales.SalesOrderHeader
WHEREYEAR(OrderDate)= 2005 ANDMONTH(OrderDate)= 7
GO
[/sql]
|
با این کوئری ساده ما اطلاعات فروش را راجع به ماه خاصی از یک سال خاص را درخواست می کنیم.خیلی پیچیده نیست. اما متاسفانه این کوئری خیلی خوب عمل نمی کند. حتی با وجود یک Nonclustered Index روی ستون OrderDate. وقتی به پلن اجرا نگاه می کنید، می توانید ببینید که Query Optimizer از Nonclustered Index که روی OrderDate تعریف شده استفاده کرده اما متاسفانه SQL Serverیک اسکن کامل به جای اینکه یک عمل Seek موثر از ایندکس انجام میدهد.
در حقیقت این یک مشکل برای SQL Server محسوب نمی شود، این روشی است که دیتابیس های رابطه ای کار می کنند و فکر می کنند! به محض اینکه یک عبارت (فراخوانی توابع یا محاسبات) روی یک ستون دارای ایندکس (که Search Argument هم نامیده می شود) اعمال کنید، موتور دیتابیس باید آن ایندکس را Scan کند، به جای اینکه یک عمل Seek انجام دهد.
راه حل
برای اینکه عمل اسکن ایندکس به Seek تغییر کند، باید کوئری را طوری بنویسیم که دیگر تابع DATEPARTفراخوانی نشود:
[sql]
— Results in an Index Seek
SELECT*FROM Sales.SalesOrderHeader
WHERE OrderDate >=’20050701’AND OrderDate <‘20050801’
GO
[/sql]
|
و همانطوری که در کوئری بازنویسی شده می بینید، این کوئری نتایج مشابهی برمی گرداند، اما ما فقط فراخوانی تابع DATEPART را حذف کرده ایم. وقتی به پلن اجرا نگاه می کنید، می بینید که SQL Server یک عمل Seek انجام می دهد- در این کوئری عمل Seekاصطلاحاً Partial Range Scanنامیده می شود: SQL Server مقدار اول را جستجو می کند و عمل اسکن را تا زمانی که به آخرین مقدار درخواستی در محدوده نرسیده ادامه می دهد. اگر مجبور هستید در متن ستون های ایندکس دار فراخوانی کنید، شما باید مطمئن شوید که این فراخوانی به تابع در سمت راست ستون شما در کوئری اجرا می شوند.
اجازه دهید به این مثال نگاهی بیندازیم. اجازه دهید به کوئری زیر نگاهی بیندازیم. کوئری زیر ستون دارای ایندکس CreditCardIDرا به دیتا تایپ CHAR(4)تبدیل می کند:
[sql] — Results in an Index Scan
SELECT*FROM Sales.SalesOrderHeader
WHERECAST(CreditCardID ASCHAR(4))=’1347′
GO
[/sql]
|
وقتی نگاهی دقیق تر به پلن اجرا دارید، می توانید ببینید SQL Server ایندکس Nonclustered را به تمامی اسکن کرده است. اگر شما این تبدیل را در سمت راست ستون ایندکس دار در کوئری اجرا کنید، می توانید دوباره می توانید فراخوانی روی ستون ایندکس دار را حذف کنید و SQL Server خواهد توانست عمل Seek انجام دهد:
[sql] — Results in an Index Seek
SELECT*FROM Sales.SalesOrderHeader
WHERE CreditCardID =CAST(‘1347’ASINT)
GO
[/sql]
|
خلاصه
همان طور که در این پست دیدید، بسیار حائز اهمیت است که هیچ تابعی مستقیم یا غیر مستقیم روی ستون های دارای ایندکس فراخوانی نکنید. در غیر اینصورت SQL Server باید ایندکس را Scan کند، به جای اینکه یک عمل Seek موثر انجام دهد.
هیچوقت به داشتن سرکارگر عادت نکن
ژانویه 2016، تورج عزیزی
15 دیدگاه
میلاد فیروزی
بسیار جالب بود جناب عزیزی
محمد خاندردی
بسیار عالی و موثر توضیح دادید … با تشکر
محمدحسین عبدالهی
بسیار عالی
متشکرم
فقط اگر میشد بعد از بندی که اشاره کردین به Partial Range Scan تصویر نتیجه رو هم نمایش میدادین به نظرم بهتر میشد.
سعید شیرزادیان
محمدحسین عبدالهی
آقای تورج عزیزی مجدد تشکر می کنم بابت مقاله خوبتون
من دو تا کوئری شما رو در AdventureWorks2014 تست کردم در ابتدا هیچ تفاوتی مشاهده نشد.
بعد برای جدول SalesOrderHeader یک ایندکس گذاشتم و تفاوت اساسی مشاهده شد! (93% به 7%)
به این صورت نتیجه گیری کردم :
در شرط جستجو ، زمانی که تبدیل نوع یک ستون – ایندکس گزاری شده – در سمت راست باشد اس کیو ال سرور از Index Seek برای نمایش نتیجه استفاده می کند. ( نکته : فقط برای ستون ایندکس گذاری شده این موضوع تأثیر گذار هست)
می خواستم ببینم درست هست این نتیجه گیری؟
مسعود طاهری
در مقاله به همین موضوعی که شما فرمودید اشاره شده و نتیجه گیری شما درست است
محمدحسین عبدالهی
تشکر استاد طاهری
تورج عزیزی
سلام محمد حسین جان عزیز،
محمدحسین عبدالهی
سلام
تشکر آقای عزیزی
توضیح خلاصه و مفیدی بود
فرشید علی اکبری
سلام
مهدی ربانی ذبیحی
سلام بسیار عالی و کاربردی بود ممنون
فرزین
بسیار عالی
ساقی
متشکریم.نکته خیلی عالی بود
رقيه حجازی
تشکر
احمد رضاپور
بسیار خوب بود؛ با تشکر..