نرمال سازی پایگاه داده | با مفهوم نرمال سازی بیشتر آشنا شوید

نرمال سازی پایگاه داده | با مفهوم نرمال سازی بیشتر آشنا شوید

نوشته شده توسط: تیم فنی نیک آموز
تاریخ انتشار: ۲۲ مرداد ۱۴۰۳
آخرین بروزرسانی: ۲۳ مرداد ۱۴۰۳
زمان مطالعه: 12 دقیقه
۵
(۲)

نرمال سازی پایگاه داده از جمله مفاهیم مهم در مدیریت دیتابیس‌ها است و این مفهوم به کارآمد بودن طراحی دیتابیس کمک زیادی خواهد کرد. زمانی که قرار است جداولی بهینه طراحی شوند که دارای افزونگی و انباشت اضافی دیتا نیستند، می‌توان از مفاهیم نرمال سازی برای بهبود امور استفاده کرد. نرمالیزاسیون کمک خواهد کرد تا بتوان اندازه پایگاه داده را تا حدود قابل توجهی کاهش داد و داده‌ها را به صورت بهینه و منطقی ذخیره‌سازی کرد. در این مطلب قصد داریم تا شما را با این قابلیت و مزایای بی‌نظیر آن آشنا کنیم.

دوره سنگ بنای پایگاه داده نیک آموز

تعریف نرمال سازی پایگاه داده

زمانی که ادگار فرانک مفهوم نرمال سازی پایگاه داده را ارائه داد، شاید فکر این را می‌کرد که این مفهوم به زودی محبوبیت زیادی در دنیای فناوری پیدا خواهد کرد. ادگار فرانک بیان می‌کند که نرمال‌سازی برای ایجاد جداول به صورت بهینه و برقراری ارتباط بین آن‌ها براساس قواعد معین خواهد بود تا بتوان از تکرار بی‌رویه دیتاها جلوگیری کرد. 

سیستم‌های بانک اطلاعاتی در شرکت‌ها و سازمان‌ها از بخش‌های بسیار مهم به شمار می‌روند و برای تسریع عملیات‌ها و ذخیره‌سازی نتایج می‌توان از آن استفاده کرد. با این حال، در بسیاری از مواقع و در صورت توجه نداشتن به اصول طراحی دیتابیس ممکن است مشکلاتی به وجود آید. یکی از این مشکلات Redundancy یا همان افزونگی است که با پیچیده‌تر شدن برنامه مطمئنا باعث بروز دردسرهایی برای مدیران پایگاه داده و برنامه‌نویسان خواهد شد. نرمال سازی پایگاه داده دقیقا در همین مرحله به داد ما می‌رسد تا بتوان در چند مرحله از مشکلات سخت و طاقت‌فرسا در آینده اجتناب کرد. 

مفاهیم اساسی نرمال سازی پایگاه داده

دقت داشته باشید که با در نظر داشتن Database Normalization ما مفاهیم را در دل پایگاه داده جای خواهیم داد. این به آن معنی است که از همان ابتدای طراحی ساختار دیتابیس لازم است تا مفاهیم را در نظر داشته باشیم تا پس از اجرای کار به بهینه‌سازی موردنیاز دست پیدا کنیم. قبل از یادگیری نرمال سازی دیتابیس بهتر است به مفاهیم کلی در این مورد بپردازیم تا با دید بهتری از این قابلیت در زمان طراحی دیتابیس استفاده کنیم:

افزونگی داده Data Redundancy

افزونگی داده شاید یکی از دردسرهای بزرگ مدیران دیتابیس و توسعه‌دهندگان باشد. این مسئله دقیقا به تکرار داده‌ها در پایگاه داده اشاره دارد و مطمئنا امکان هدر رفت فضای ذخیره‌سازی و بروز مشکلات بهینه‌‌سازی با این افزونگی دور از انتظار نیست. 

انسجام داده Data Consistency 

انسجام داده به معنی آن است که دیتا را به صورت یکنواخت و بدون تضاد در پایگاه داده ذخیره کنیم. در صورت ذخیره شدن دیتاها در بخش‌های مجزا به صورت متناقض، مطمئنا مشکلاتی برای تحلیل و مدیریت داده‌ها به وجود خواهد آمد. تصور کنید که با تعریف روابط صحیح بین جداول و دیتاهای داخلی آن، می‌توان انسجام داده‌ها را حفظ کرد. 

وابستگی ها Dependencies 

در طراحی دیتابیس، وابستگی‌ها به روابط بین داده‌ها و نحوه تاثیر آن‌ها روی همدیگر اشاره دارند. این وابستگی‌ها داخل جداول و بین جدول‌ها وجود دارند و در بعضی از مواقع ممکن است وابستگی‌ها بسیار پیچیده شوند. نرمال سازی پایگاه داده این وابستگی‌ها را کاهش می‌دهد و به این صورت پایگاه داده بهینه‌تر خواهد بود. 

فرم های نرمال 

فرم‌های نرمال به مجموعه‌ای از قواعد گفته می‌شود که برای ساختاردهی بهتر جداول پایگاه داده به کار می‌روند. هر فرم نرمال برای یک ویژگی خاص در طراحی دیتابیس به کار خواهد رفت. 

تجزیه یا Decomposition

تجزیه یا همان Decomposition کمک خواهد کرد تا بتوان یک جدول را به جدول‌های کوچک‌تر تقسیم‌بندی کرد. به این صورت، بسیاری از وابستگی‌ها بهینه‌تر خواهند شد. 

ترکیب یا Join

در بسیاری از موارد نیاز است تا جداول با هم ترکیب شوند. این ترکیب کردن نیاز به یک مهارت خاص دارد و باید در این مورد تسلط بالایی داشته باشید تا بدون مشکل عملیات ترکیب یا تجزیه جداول را انجام دهید. 

سطوح نرمال سازی (Normal Forms)

نرمال سازی دیتابیس شامل چند مرحله است که با نام فرم‌های نرمال نیز شناخته می‌شوند. فرم اول، فرم دوم، فرم سوم و حتی فرم بویس-کاد در این مورد معروف هستند و از آن می‌توان به صورت مرحله‌به‌مرحله برای رسیدن به بهترین نتیجه استفاده کرد. 

قوانین خاصی در این فرم‌های نرمال‌سازی در نظر گرفته شده است که در هر مرحله باید آن‌ها را در نظر داشته باشیم. 

فرم نرمال اول ۱NF

زمانی که فرم نرمال اول روی جدولی در نظر گرفته می‌شود، عملیات اساسی مانند جستجو، فیلترسازی و مرتب کردن روی جدول نیز آسان‌تر و سریعتر خواهد شد. داده‌ها در جداول پایگاه داده در سطرها و ستون‌هایی قرار دارند که کلیدهای اصلی وظیفه شناسایی هر سطر را به صورت منحصربه‌فرد دارند. 

در این فرم نرمال هر ستون دارای مقادیر اتمی است و در جدول نباید گروه‌هایی از ستون‌ها تکرار داشته باشند. 

در مورد فرم نرمال ۱NF مقادیر ستون‌ها اتمی هستند و نمی‌توان چند دیتا را با استفاده از ویرگول یا هر کاراکتر دیگری لیست کرد. برای مثال، Tehran می‌تواند اتمی باشد اما Tehran, Shiraz, Tabriz اتمی نیست. 

  • در نرمال فرم شماره یک هر ستون نباید دارای مقادیر تکراری باشد. 
  • همچنین، مجموعه داده یا لیستی از داده‌ها قابل قبول نیست. 
  • همه ستون‌ها باید دارای یک نوع داده باشند. 

برای مثال جدول زیر براساس نرمال فرم ۱NF استاندارد نیست:

 

StudentID StudentName Courses
۱ Alice Math, Science
۲ Bob Math, History, Literature
۳ Charlie Science, History

 

در این جدول برای جستجوی دانشجویانی که درس Math را گذرانده‌اند، باید جستجو را با جزئیات بیشتری انجام داد که در جداول پیچیده بسیار دشوارتر خواهد بود:

 

SELECT StudentID, StudentName
FROM StudentCourses
WHERE Course = 'Math';

 

برای نرمال سازی پایگاه داده در مورد این جدول می‌توان به صورت زیر عمل کرد:

 

StudentID StudentName Courses
۱ Alice Math
۱ Alice Science
۲ Bob Math
۲ Bob History
۲ Bob Literature
۳ Charlie Science
۳ Charlie History

 

در این جدول به راحتی می‌توان عملیات جستجو را انجام داد:

 

SELECT StudentID, StudentName
FROM StudentCourses
WHERE Course = 'Math';

 

فرم نرمال دوم ۲NF 

نکته مهم برای رسیدن به فرم نرمال دوم این است که فرم نرمال اول روی جدول اعمال شده باشد. در این صورت دست ما برای رسیدن به مرحله بعدی بسیار باز است. در این فرم نرمال تمامی ستون‌های غیر کلید به کلید اصلی جدول وابسته هستند تا بتوان به طرز واضح و بهینه به دیتاها دسترسی داشت. 

با استفاده از این قابلیت می‌توان افزونگی داده ۱NF را جبران کرد و وابستگی‌های جزئی را نیز حذف کرد. این امر کارایی دیتابیس را بهبود خواهد داد و می‌تواند باعث افزایش سازگاری و یکپارچگی دیتابیس شود. 

 

StudentID CourseID StudentName CourseName Professor
۱ ۱۰۱ Alice Math Dr. Smith
۲ ۱۰۲ Bob Science Dr. Jones
۱ ۱۰۲ Alice Science Dr. Jones
۳ ۱۰۱ Charlie Science Dr. Smith

 

جدول بالا در حالت ۱NF نرمال است. برای اطمینان از نرمال بودن جدول در حالت ۲NF بهتر است جداول را به سه بخش تقسیم‌بندی کنیم که به صورت زیر خواهد بود:

 

StudentID StudentName
۱ Alice
۲ Bob
۳ Charlie

 

CourseID CourseName Professor
۱۰۱ Math Dr. Smith
۱۰۲ Science Dr. Jones

 

StudentID CourseID
۱ ۱۰۱
۲ ۱۰۲
۳ ۱۰۲
۴ ۱۰۱

 

اکنون، سه جدول داریم که هیچ‌گونه وابستگی جزئی ندارند و تمام اطلاعات به صورت کامل به کلید اصلی جداول مربوطه وابسته‌اند. به این ترتیب، جداول ما در فرم نرمال دوم (۲NF) قرار دارند.

فرم نرمال سوم ۳NF 

برای ورود به فرم نرمال سوم نیاز است تا جدول موردنظر به صورت ۲NF باشد. در فرم ۲NF جدول فقط شامل ستون‌هایی است که به طور غیرگذرا Non-Transitive به کلید اصلی وابسته هستند. وابستگی‌های گذرا منجر به ایجاد روابط غیرمستقیم بین مقادیر در جدول می‌شود. این امر باعث می‌شود تا یک ستون از طریق یک ستون میانی به ستون دیگری متکی باشد. 

یکی از دلایل اصلی که از ۳NF برای نرمال سازی پایگاه داده استفاده می‌شود، کاهش احتمال ایجاد به روز رسانی‌های ناهماهنگ است. در فرم نرمال سوم تغییرات در داده فقط در یک محل انجام می‌پذیرد و این باعث کاهش احتمال خطاهای این چنینی خواهد شد. همچنین، اگر وابستگی‌های میانی را از بین ببریم، در آینده از مشکلاتی مانند حذف غیرمنتظره دیتا و مشکلات ناشی از درج داده در امان خواهیم ماند. 

 

StudentID StudentName CourseID CourseName Professor Department
۱ Alice ۱۰۱ Math Dr. Smith Mathematics
۲ Bob ۱۰۲ Science Dr. Jones Science
۱ Alice ۱۰۲ Science Dr. Jones Science
۳ Charlie ۱۰۱ Math Dr. Smith Mathematics

 

این جدول در فرم نرمال ۱NF به صورت زیر خواهد بود:

 

StudentID StudentName
۱ Alice
۲ Bob
۳ Charlie

 

CourseID CourseName Professor Department
۱۰۱ Math Dr. Smith Mathematics
۱۰۲ Science Dr. Jones Science

 

StudentID CourseID
۱ ۱۰۱
۲ ۱۰۲
۱ ۱۰۲
۳ ۱۰۱

 

برای تبدیل به فرم نرمال سوم، باید اطمینان حاصل کنیم که هیچ وابستگی انتقالی بین ویژگی‌های غیر کلیدی وجود ندارد. در جدول Courses، ستون‌های Professor و Department به CourseID وابسته‌اند. اما اگر بخواهیم تغییراتی مانند انتقال پروفسور یا تغییر دپارتمان را بدون تکرار اطلاعات انجام دهیم، بهتر است جدول دیگری برای اطلاعات پروفسورها داشته باشیم.

جدول Professor به صورت زیر است:

 

Professor Department
Dr. Smith Mathematics
Dr. Jones Science

 

جدول به روز رسانی شده Courses به صورت زیر است:

 

CourseID CourseName Professor
۱۰۱ Math Dr. Smith
۱۰۲ Science Dr. Jones

 

اکنون، با داشتن سه جدول “Students”، “Courses” و “Professors”، هیچ وابستگی انتقالی بین ویژگی‌های غیر کلیدی نداریم و تمامی جداول ما در فرم نرمال سوم (۳NF) قرار دارند. این کار باعث می‌شود تا به‌ روزرسانی داده‌ها ساده‌تر و بدون افزونگی انجام شود.

روند نرمال سازی پایگاه داده

نرمال‌سازی پایگاه داده فرآیندی است که برای سازماندهی داده‌ها در جداول به منظور کاهش افزونگی و افزایش یکپارچگی استفاده می‌شود. این فرآیند شامل چندین مرحله به نام فرم‌های نرمال است. ابتدا، فرم نرمال اول (۱NF) اطمینان حاصل می‌کند که هر ستون دارای مقادیر اتمیک است و جداول تکراری حذف می‌شوند. سپس، فرم نرمال دوم (۲NF) وابستگی‌های جزئی بین ویژگی‌های غیر کلیدی و کلید اصلی را حذف می‌کند. فرم نرمال سوم (۳NF) وابستگی‌های انتقالی را از بین می‌برد. مراحل پیشرفته‌تر مانند فرم نرمال بویس-کد (BCNF)، فرم نرمال چهارم (۴NF) و فرم نرمال پنجم (۵NF) به ترتیب به حذف وابستگی‌های پیچیده‌تر و بهبود بیشتر ساختار داده‌ها می‌پردازند. نتیجه این مراحل، پایگاه داده‌ای بهینه و کارآمد است که از مشکلات افزونگی و ناسازگاری داده‌ها جلوگیری می‌کند.

اشتباهات رایج در نرمال سازی

در فرآیند نرمال سازی پایگاه داده اشتباهات رایجی وجود دارند که می‌توانند مشکلاتی را به وجود آورند. این مشکلات به صورت مستقیم روی ساختار داده‌ها و کارایی دیتابیس پس از نرمال‌سازی تاثیر خواهد گذاشت.

برای مثال، نگهداری مقادیر تکراری یا مجموعه‌ای در یک سلول باعث خواهد شد تا نرمال سازی پایگاه داده به کلی با مشکل مواجه شود. بنابراین، باید اطمینان حاصل کنید که تنها مقادیر اتمیک در هر ستون نگهداری خواهند شد. 

همچنین، وابستگی‌های جزئی و میانی باعث خواهند شد تا مشکلاتی برای نرمال سازی پایگاه داده به وجود آید. همچنین، تقسیم بیش از حد جداول می‌تواند باعث بروز پیچیدگی‌های اضافی و کاهش کارایی در انجام کوئری‌ها شود. 

ابزارها و نرم افزارهای پشتیبانی کننده نرمال سازی

در صورتی که هدف شما پیاده‌سازی نرمال سازی پایگاه داده است، می‌توانید از ابزارهای مختلف DBMS برای این کار استفاده کنید. به بیان بهتر، مشکلی از نظر پیاده کردن این قابلیت‌ها در دیتابیس‌های مدرن وجود ندارد. 

از بهترین ابزارها و نرم افزارها در این مورد می‌توان به فهرست زیر اشاره کرد:

  • ابزار مدیریتی MySQL
  • ابزار مدیریتی SQL Server 
  • ابزار مدیریتی SQLite 

مقایسه بین نرمال سازی و دینرمال سازی (Denormalization)

دو مفهوم مهم در طراحی دیتابیس وجود دارد که با نام‌های نرمال سازی پایگاه داده و دینرمال سازی آن شناخته می‌شوند. در این بخش قصد داریم تا یک مقایسه کلی بین این دو مفهوم ارائه دهیم:

  • نرمال‌سازی به معنی تجزیه داده‌ها به جداول متعدد است تا بتوان افزونگی داده را کاهش داد و به یکپارچگی بهتری در دیتابیس دست پیدا کرد. دینرمال سازی مفهومی است که برای ترکیب کردن دیتا در جداول واحد اطلاق می‌شود تا بتوان فراخوانی دیتاها را سریعتر کرد. 
  • نرمال سازی پایگاه داده به کاهش Data Redundancy کمک خواهد کرد و این در حالی است که دینرمال‌سازی این موضوع را تشدید می‌کند. 
  • حجم پایگاه داده روی دیسک در نرمال‌سازی کاهش خواهد داشت و این در حالی است که دینرمال‌سازی حجم دیسک را افزایش می‌دهد. 

در عمل، انتخاب بین نرمال سازی دیتابیس و دینرمال‌سازی آن بستگی به نیازهای خاص سیستم، حجم دیتاها و نوع بار کاری دارد. بنابراین، شاید برای یک شرکت تصمیم بر استفاده نکردن از نرمال‌سازی باشد و در یک شرکت دیگر این یک نیاز اساسی باشد. 

جمع بندی: نرمال سازی پایگاه داده

نرمال سازی پایگاه داده یکی از اساسی‌ترین نیازها است در صورتی که هدف شما یادگیری و استفاده از دیتابیس‌ها به صورت بهینه است. بهترین کار این است که در همان قدم‌های ابتدایی به این مفاهیم مسلط شوید چرا که ندانستن آن منجر به بروز مشکلاتی در مسیر شما خواهد شد. با شرکت در یک دوره جامع‌وکامل می‌توانید به همراه مثال‌های عملی و مطمئن این مرحله را نیز با موفقیت پشت سر بگذارید. 

چه رتبه ای می‌دهید؟

میانگین ۵ / ۵. از مجموع ۲

اولین نفر باش

title sign
معرفی نویسنده
تیم فنی نیک آموز
مقالات
373 مقاله توسط این نویسنده
محصولات
0 دوره توسط این نویسنده
تیم فنی نیک آموز
title sign
دیدگاه کاربران

    • سلام و عرض ادب و سپاس بابت مقاله ای که گذاشتید
      ممنون یمشم که یک مثال و نمونه واقعی بصورت نرمال سازی نشده از یک دیتا قرار دهید و مراحل نرمال سازی را استپ به استپ انجام بدید تا با پیچیدگی هیا کار هم اشنا بشیم.این مثال خیلی مثال شلوغ و سختی نبود .

هر روز یک ایمیل، هر روز یک درس
آموزش SQL Server بصورت رایگان
همین حالا فرم زیر را تکمیل کنید
دانلود رایگان جلسه اول
نیک آموز علاوه بر آموزش، پروژه‌های بزرگ در حوزه هوش تجاری و دیتا انجام می‌دهد.
close-link