حذف ردیف های تکراری یک جدول

نوشته شده توسط: تیم فنی نیک آموز

تاریخ انتشار: ۰۸ دی ۱۴۰۱

آخرین بروزرسانی: 03 بهمن 1403

زمان مطالعه: 8 دقیقه

حذف ردیف‌های تکراری SQL، هنگام طراحی object ها در SQL Server باید بهترین روش‌ها را انتخاب کنیم. به عنوان مثال، یک جدول باید دارای کلیدهای اصلی، ستون‌های هویت، ایندکس‌های clustered, non-clustered محدودیت‎‌هایی برای اطمینان از یکپارچگی و عملکرد داده‌‎ها باشد. حتی اگر بهترین روش‌ها را دنبال کنیم، ممکن است با مشکلاتی مانند ردیف‌های تکراری مواجه شویم. می‌خواهیم ردیف‌های تکراری را قبل از درج در جداول حذف کنیم.

فرض کنید جدول SQL شما حاوی ردیف‌های تکراری است و می‌خواهید آن ردیف‌های تکراری را حذف کنید. خیلی وقت‌ها با این مسائل مواجه می‌شویم. بهترین روش استفاده از کلیدهای مربوطه محدودیت‌ها برای از بین بردن امکان تکرار ردیف‌ها است. اما اگر ردیف‌های تکراری از قبل در جدول وجود داشته باشد، برای پاکسازی داده‌های تکراری، باید روش‌های خاصی را دنبال کنیم. این مقاله روش‌های مختلف برای حذف داده‌های تکراری از جدول SQL را بررسی می‌کند.

قدم اول:

ابتدا با دستور use دیتابیس master را فراخوانی می‌کنیم.

--فراخوانی دیتابیس 
use master
go
--create employee table
create table employeetable(
ID int identity(1,1),
firstname varchar(100),
lastname varchar(100),
country varchar(100))
go
--insert values to employee table
insert into employeetable(firstname,lastname,country)
values('Raj','gupta','india'),
('Raj','gupta','india'),
('ali','ahmai','canada'),
('naser','amini','tehran'),
('James','Barry','UK'),
('James','Barry','UK')
--نمایش رکوردهای جدول
select * from employeetable

در جدول فوق، تعدادی رکورد تکراری داریم می‌خواهیم رکوردهای تکراری را حذف کنیم.

روش اول: استفاده از عبارت SQL GROUP BY

راه حل ۱: استفاده از group, clause برای حذف ردیف‌های تکراری در یک جدول در SQL Server. در این روش از عبارت SQL GROUP BY برای شناسایی ردیف‌های تکراری استفاده می‌کنیم. عبارت Group By داده‌ها را طبق ستون‌های تعریف شده، گروه‌بندی می‌کند و می‌توانیم از تابع COUNT برای بررسی وقوع یک ردیف استفاده کنیم.

به عنوان مثال، کوئری زیر را اجرا کنید. آن رکوردها را در جدول Employee بزرگ‌تر از ۱ مشاهده می‌کنیم.

select 
firstname,
lastname,
country,
COUNT(*) as 'count of rows'
from employeetable
group by 
firstname,lastname,country
having COUNT(*)>1

همانطور که در جدول فوق مشاهده می‌کنیم، ردیف اول دیتا ۲ بار تکرار شده است و ردیف دوم دیتا ۲ بار تکرار شده است.

مشاهده کامل‌ترین و بروزترین آموزش sql server در نیک آموز

روش دوم: استفاده از subquery

ما باید یک ردیف را نگه داریم و ردیف‌های تکراری را حذف کنیم. ما باید فقط ردیف‌های تکراری را از جدول حذف کنیم. به عنوان مثال، EmpID 1 دو بار در جدول ظاهر می‌شود. ما می‌خواهیم فقط یک مورد از آن را حذف کنیم.

select * from employeetable
where ID not in 
(Select MAX(ID)
from employeetable
group by firstname,lastname,country
);

خروجی کوئری فوق مطابق تصویر زیر است:

در تصویر زیر می‌بینیم که عبارت Select بالا، Max id هرردیف تکراری را حذف می‌کند و فقط حداقل مقدار ID را دریافت می‌کنیم.

برای حذف این داده‌ها، مطابق عبارت زیر، عبارت Select را با عبارت delete در SQL Server جایگزین کنید.

delete from employeetable
where ID not in (select MAX(ID)'max of rows' from employeetable
group by firstname,lastname,country
)
select * from employeetable

روش سوم: حذف داده‌های تکراری با استفاده از دستور CTE

ما می‌توانیم داده‌های تکراری با استفاده از دستور CTE حذف کنیم.

WITH CTE ([firstname],[lastname],[country],duplicatecount)
as (select firstname
,lastname
,country,
 ROW_NUMBER() over (PARTITION by firstname,lastname,country order by id) as duplicatecount   from employeetable
)
delete from CTE where duplicatecount>1

روش چهارم: استفاده از rank function

ما می‌توانیم از تابع SQL RANK برای حذف ردیف‌های تکراری نیز استفاده کنیم. تابع SQL RANK برای هرردیف بدون در نظر گرفتن ردیف تکراری، شناسه ردیف منحصربه‌فرد می‌دهد.

در کوئری زیر از تابع RANK با عبارت PARTITION BY استفاده می‌کنیم. عبارت PARTITION BY زیرمجموعه‌ای از داده‌ها را برای ستون‌های مشخص شده آماده می‌کند و برای آن پارتیشن رتبه می‌دهد. برای این منظور کوئری زیر را می‌نویسیم:

select 
e.ID,
e.firstname,
e.lastname,
e.country,
t.rankid
from [employeetable] e
inner join
(select *,
RANK() over (PARTITION by firstname,lastname,country
order by id)  rankid
from [employeetable]) t 
on e.ID=t.ID;

خروجی کوئری فوق مطابق تصویر زیر است:

در تصویر بالا، باید توجه داشته باشید ردیفی را که دارای رتبه بزرگ‌تر از یک است، حذف کنیم. برای این کار از پرس‌وجو زیر استفاده کنید.

select 
e.ID,
e.firstname,
e.lastname,
e.country,
t.rankid
from [employeetable] e
inner join
(select *,
RANK() over (PARTITION by firstname,lastname,country
order by id)  rankid
from [employeetable]) t 
on e.ID=t.ID
where t.rankid>1

روش پنجم: استفاده از پکیج SSIS

برای این منظور، ابتدا یک پکیج جدید در محیط integration service ایجاد می‌کنیم. در SQL Server Data Tools، یک بسته Integration جدید ایجاد کنید. در بسته جدید، یک OLE DB Source اضافه کنید. ویرایشگر Source OLE DB را باز کنید و اتصال source کنید و جدول مقصد را انتخاب کنید.

یک عملگر مرتب‌سازی را از جعبه ابزار برنامه SSIS برای عملیات حذف SQL اضافه کنید و آن را با داده‌های منبع بپیوندید.

برای پیکربندی عملگر Sort، روی آن دوبار کلیک کرده و ستون‌هایی که حاوی مقادیر تکراری هستند را انتخاب کنید. در مورد ما، مقدار تکراری در ستون‌های [FirstName]، [LastName]، [Country] است. همچنین می‌توانیم از انواع مرتب‌سازی صعودی یا نزولی برای ستون‌ها استفاده کنیم. روش مرتب‌سازی پیش‌فرض، صعودی است. در ترتیب مرتب‌سازی می‌توانیم ترتیب مرتب‌سازی ستون را انتخاب کنیم. ترتیب مرتب‌سازی ۱ ستونی را نشان می‌دهد که ابتدا مرتب می‌شود. افراد علاقه‌مند می‌توانند با مطالعه مقاله پرکاربردترین دستورات SQL Server، دانش خود را در زمینه کوئری‌نویسی گسترش دهند.

در سمت چپ پایین، به کادر انتخاب Remove rows with Duplicate مرتب‌سازی توجه کنید. وظیفه حذف ردیف‌های تکراری را برای ما از داده‌های source انجام می‌دهد. می‌توانیم مقصدهای SQL Server را برای ذخیره داده‌ها پس از حذف ردیف‌های تکراری اضافه کنیم. ما فقط می‌خواهیم بررسی کنیم که آیا عملگر مرتب‌سازی کار را برای ما انجام می‌دهد یا خیر؟ همانطور که در زیر نشان داده شده است، یک تبدیل SQL Multicast را از جعبه ابزار SSIS اضافه کنید.

برای مشاهده داده‌های متمایز، برروی رابط بین Sort و Multicast کلیک راست کنید. روی Enable Data Viewer کلیک کنید. پکیج را برای انجام عملیات delete SQL اجرا کنید. این نمایشگر داده خروجی مرتب‌سازی را در وظیفه جریان داده باز می‌کند. در این نمایشگر داده، پس از حذف مقادیر تکراری، می‌توانید داده‌های متمایز را مشاهده کنید.

سخن پایانی

در این مقاله، فرآیند حذف ردیف‌های تکراری SQL را با استفاده از روش‌های مختلف مانند بسته T-SQL، CTE و SSIS بررسی کردیم. می‌توانید از روشی استفاده کنید که در آن احساس راحتی می‌کنید. با این حال، من پیشنهاد می‌کنم این رویه‌ها و بسته‌ها را مستقیماً روی داده‌های Production پیاده‌سازی نکنید. ما در نیک آموز منتظر نظرات ارزشمند شما درباره این مقاله هستیم.

دانلود مقاله

حذف ردیف های تکراری یک جدول

فرمت PDF

صفحه

حجم مگابایت

دانلود مقاله

معرفی نویسنده

مقالات

418 مقاله توسط این نویسنده

محصولات

0 دوره توسط این نویسنده

تیم فنی نیک آموز

معرفی محصول

ایمان باقری

آموزش کوئری نویسی در sql server

2.190.000 تومان

مقالات مرتبط

۰۲ آبان

SQL Server

ابزار Database Engine Tuning Advisor

تیم فنی نیک آموز

۱۵ مهر

SQL Server

معرفی Performance Monitor ابزار مانیتورینگ SQL Server

تیم فنی نیک آموز

۱۱ مهر

SQL Server

راهنمای جامع مانیتورینگ بکاپ ها در SQL Server

تیم فنی نیک آموز

Resource Governor چیست؟ آشنایی با نحوه پیکربندی و اهمیت های آن

۰۸ مهر

SQL Server

Resource Governor چیست؟ آشنایی با نحوه پیکربندی و اهمیت های آن

تیم فنی نیک آموز

دیدگاه کاربران

لغو پاسخ

دیدگاه

نام و نام خانوادگی

ایمیل

موبایل

برای اطلاع از پاسخ لطفاً مرا با خبر کن

بابک
۰۸ / ۰۹ / ۰۲ - ۰۹:۰۷

روش اول که توضیح دادین دستور کویری حذف را ننوشتین …
تشکر از سایت خوب شما
مهدی
۱۸ / ۰۳ / ۰۲ - ۰۶:۵۴

سلام و وقت بخیر
اگر آی دی ما از نوع GUID بود چه کنیم؟
جواد
۰۱ / ۱۱ / ۰۱ - ۰۳:۵۲

سلام وققتون بخیر
ممنون مقاله خوبی بود منتها یه مبحث هست که جاش توی این مقاله جاش خالیه
همه روش ها با استفاده از ایدی هست و ردیف ها یونیک هستن
در صورتی که ایدی یا ستونی برای یونیک کردن ردیف ها نداشته باشیم روش های این مقاله کار رو راه نمیندازه.
البته روش پنجم رو نمیدونم و تست نکردم

۳
۱

حذف ردیف های تکراری یک جدول

روش اول: استفاده از عبارت SQL GROUP BY

روش دوم: استفاده از subquery

روش سوم: حذف داده‌های تکراری با استفاده از دستور CTE

روش چهارم: استفاده از rank function

روش پنجم: استفاده از پکیج SSIS

سخن پایانی

آموزش کوئری نویسی در sql server

ابزار Database Engine Tuning Advisor

معرفی Performance Monitor ابزار مانیتورینگ SQL Server

راهنمای جامع مانیتورینگ بکاپ ها در SQL Server

Resource Governor چیست؟ آشنایی با نحوه پیکربندی و اهمیت های آن

لغو پاسخ

بابک

مهدی

جواد

پاپ آپ | SQL Server