Thiết kế cơ sở dữ liệu là công việc vô cùng quan trọng trong các dự án, nếu thiết kế đúng CSDL sẽ giúp việc triển khai dự án thuận lợi và tiết kiệm. Tuy nhiên, rất nhiều bạn khi mới vào nghề thường gặp khó khăn về vấn đề thiết kế cơ sở dữ liệu như:
- Làm thế nào để thiết kế được Cơ sở dữ liệu?
- Làm thế nào để biết Cơ sở dữ liệu thiết kế đúng?
Bài này chúng ta sẽ bàn về những vấn đề đó.
Thiết kế cấu trúc cơ sở dữ liệu
Thiết kế cấu trúc cơ sở dữ liệu là quá trình mô hình hóa nhằm chuyển đổi các đối tượng từ thế giới thực (Real-world system) sang các bảng trong hệ thống cơ sở dữ liệu (Database system) đáp ứng các yêu cầu lưu trữ và khai thác dữ liệu.
Mô hình hóa việc thiết kế cấu trúc cơ sở dữ liệu
Trong đó,
- People (con người): những người tham gia vào hệ thống, bạn cần làm việc với những người này để xác định các dữ liệu cần lưu trữ, cần khai thác.
- Documents (tài liệu): bạn cần khảo sát các tài liệu trong hệ thống để xác định dữ liệu.
- Facilities(cơ sở vật chất): bạn cần quan tâm những cơ sở vật chất nào cần quản lý.
- Other systems(hệ thống khác, hệ thống tương tự): bạn cần tìm hiểu nghiên cứu các hệ thống tương tự để thu thập thêm dữ liệu.
Để thực hiện việc thiết kế cơ sở dữ liệu chúng ta cần thực hiện các bước sau đây:
- Xác định các thành phần dữ liệu
- Chia nhỏ các thành phần dữ liệu ra thành các phần nhỏ nhất mà hệ thống sử dụng
- Xác định các bảng và các cột
- Xác định khóa chính, khóa ngoại và mối quan hệ
- Kiểm tra cấu trúc cơ sở dữ liệu được thiết kế với qui định chuẩn hóa
Thực hành thiết kế Cơ sở dữ liệu
Để các bạn dễ hiểu quá trình thiết kế cơ sở dữ liệu, chúng ta sẽ thực hành thiết kế cấu trúc cơ sở dữ liệu cho hệ thống quản lý đơn hàng có mẫu hóa đơn như sau:
Bước 1: Xác định các thành phần dữ liệu
Để xác định các thành phần dữ liệu chúng ta cần thực hiện các bước sau đây:
- Phân tích hệ thống hiện tại
- Đánh giá, xem xét các hệ thống tương tự
- Phỏng vấn người dùng
- Phân tích các tài liệu trong hệ thống hiện tại
Ở bài toán trên, chúng ta thu thập được dữ liệu quan trọng là mẫu hóa đơn của đơn vị đang áp dụng, chúng ta sẽ phân tích nó để định nghĩa các thành phần dữ liệu.
Khảo sát hóa đơn trên chúng ta thu được các thành phần dữ liệu sau đây:
InvoiceNo: Số hóa đơn
InvoiceDate: Ngày ghi hóa đơn
CustomerName: Tên khách hàng
CustomerCompany: Tên công ty khách hành
CustomerAddress: Địa chỉ khách hàng
CustomerAccountNo: Số tài khoản của khách hàng
PaymentMethod: Phương thức thanh toán
CustomerTaxNo: Mã số thuế của khách hàng
SequenceNo: Số thứ tự mua hành
ProductName: Tên sản phẩm
Unit: Đơn vị tính của sản phẩm
Quantity: Số lượng
UnitPrice: Đơn giá
Amount: Thành tiền
TotalAmount: Tổng tiền
VAT: Thuế giá trị gia tăng
TotalPay: Tổng tiền phải trả
ByText: Ghi bằng chữ
Lưu ý: Vì tiếng việt có dấu dễ gây lỗi khi code, nếu dùng không dấu thì dễ gây nhầm lẫn nên tôi khuyên các bạn nên đặt tên các thành phần dữ liệu theo tiếng Anh vừa tránh được các lỗi trên vừa giúp bạn dễ dàng tham gia các dự án quốc tế sau này.
Loại bỏ các dữ liệu trùng ở các dạng sau:
- Hai thành phần dữ liệu nhưng trỏ đến một thành phần dữ liệu thực tế
- Bỏ những thành phần tính toán được
- Những trường không cần lưu trữ hoặc không có thực
Xem xét danh sách các thành phần ở trên chúng ta loại các trường sau:
Amount: Thành phần này được tính từ đơn giá * số lượng
TotalAmount: Thành phần này được tính bằng tổng các mục thành tiền.
TotalPay: Thành phần này được tính bằng TotalAmount - VAT amount
ByText: Được đọc từ tổng tiền phải trả.
Các thành phần không cần như thông tin đơn vị bán, chữ ký người mua, chữ ký kế toán… Có nhưng thực sự bạn không cần lưu cùng đơn hàng vào cơ sở dữ liệu.
Bước 2: Chia nhỏ các thành phần dữ liệu thành đơn vị nhỏ nhất hữu dụng
Để hiểu phần này bạn xem xét ví dụ sau:
CustomerName có giá trị là Nguyễn Văn A, trường này có thể tách ra là Lastname (Nguyễn), Middlename (Văn) và Firstname (A). Tuy nhiên, có hệ thống thì lưu hết vào một trường là ‘Nguyễn Văn A’ như giao hàng chẳng hạn, có hệ thống chia ra là ‘Nguyễn Văn’, ‘A’ như hệ thống quản lý sinh viên, có hệ thống chia ra thành ‘Nguyễn’, ‘Văn’, ‘A’ như hệ thống quản lý bay… Do vậy, bạn cần xem xét hệ thống bạn đang xây dựng sẽ lưu như thế nào.
Trong hệ thống này do hay sắp xếp theo tên khách hàng nên chúng ta tách nó ra thành 02 phần là CustomerLastName và CustomerFirstName.
Tương tự trường CustomerAddress cung vậy, để quản lý theo tỉnh/thành phố và quận/huyện chúng ta chia nó ra thành 03 trường như sau: CustomerAddress, CustomerDistrict và CustomerCity.
Bạn hãy xem xét các trường còn lại xem có phải tách trường nào ra nữa hay không.
Sau khi tách các trường cần thiết và loại bỏ các trường không cần thiết ta có các thành phần dữ liệu như sau:
InvoiceNo: Số hóa đơn
InvoiceDate: Ngày ghi hóa đơn
CustomerFirstName: Tên khách hàng
CustomerLastName: Họ và tên lót của khách hàng
CustomerCompany: Tên công ty khách hành
CustomerAddress: Địa chỉ khách hàng
CustomerCity: Thành phố khách hàng đang ở
CustomerDistrict: Quận khách hàng đang ở
CustomerAccountNo: Số tài khoản của khách hàng
PaymentMethod: Phương thức thanh toán
CustomerTaxNo: Mã số thuế của khách hàng
SequenceNo: Số thứ tự mua hành
ProductName: Tên sản phẩm
Unit: Đơn vị tính của sản phẩm
Quantity: Số lượng
UnitPrice: Đơn giá
Amount: Thành tiền
VAT: Thuế giá trị gia tăng
Bước 3: Xác định các bảng và các cột cho cơ sở dữ liệu
Thực hiện theo các bước sau:
- Nhóm các trường theo các thực thể (Entities)
- Kiểm tra lại các trường thừa/thiếu.
Chúng ta bàn về thực thể, thực thể là người, là vật tồn tại trong hệ thống đang xem xét. Đối với thiết kế Cơ sở dữ liệu chúng ta chỉ quan tâm đến các thực thể mang thông tin. Xem xét danh sách các thành phần dữ liệu từ trên xuống chúng ta có thể liệt kê ra các thực thể thấy được như sau:
- Invoice(Hóa đơn)
- Customer (Khách hàng)
- Product (Sản phẩm)
Có thể bạn sẽ thấy khó hiểu chỗ này, bạn cần suy nghĩ kỹ để hiểu lý do vì sao chọn được 03 thực thể trên.
1.Tiếp theo chúng ta nhóm các thành phần dữ liệu tương ứng vào các thực thể
2. Kiểm tra các trường thừa/thiếu
- Nếu có trường thừa ra, bạn cần xem xét nó có thực sự cần lưu trữ không? Nếu cần lưu trữ thì bạn cần bổ sung thực thể chứa thuộc tính này. Nếu không cần lưu trữ bạn cần loại bỏ nó đi.
- Bạn cần kiểm tra từng thực thể xem có cần bổ sung thuộc tính bào không? Nếu cần thì bạn thêm vào.
Bước 4: Xác định khóa chính, khóa ngoại và mối quan hệ giữa các thực thể
- Xác định khóa chính cho các thực thể
- Xác định quan hệ giữa các thực thể
- Phân tách để đưa về mô hình nhị nguyên
- Bổ sung khóa ngoại
a. Xác định khóa chính cho các thực thể
Khái niệm về khóa chính các bạn xem ở bài Cơ bản về cơ sở dữ liệu. Trong phần này chúng ta bàn về cách xác định khóa chính cho thực thể. Khóa chính của thực thể có thể xác định như sau:
- Chọn từ một trường có sẵn đủ điều kiện làm khóa chính như InvoiceNo chẳng hạn.
- Nếu chưa có bạn có thể bổ sung một trường tự tăng để làm khóa chính như CustomerNo, ProductNo.
Lúc này chúng ta có các thực thể như sau:
b. Xác định mối quan hệ giữa các bảng
Xem xét các thực thể bạn có để xác định các định mối quan hệ của chúng, chúng ta có các thực thể Customer, Product và Invoice thì mối quan hệ của chúng chỉ có thể là Customer mua Product và sinh ra Invoice để ghi nhận thông tin.
Mối quan hệ trong thế giới thực của các thực thể. Chuyển sang mô hình thực thể nó được biểu diễn như sau:
Xác định loại quan hệ giữa các thực thể như sau:
- Quan hệ giữa Customer và Invoice, chúng ta thấy mỗi khách hàng có thể mua nhiều đơn hàng, nhưng mỗi đơn hàng chỉ bán cho 1 khách hàng. Do vậy quan hệ này là 1-n.
- Tương tự quan hệ giữa Invoice và Product, mỗi hóa đơn có thể mua nhiều sản phẩm, mỗi sản phẩm có thể bán cho nhiều hóa đơn nên quan hệ này là quan hệ n-n.
c. Phân tách các quan hệ để đưa về mô hình nhị nguyên
Theo mô hình cơ sở dữ liệu quan hệ nếu bạn để tồn tại mối quan hệ n-n nó sẽ gây ra dư thừa dữ liệu (xem bài vấn đề dư thừa dữ liệu). Do vậy, bạn cần tách quan hệ ra thành các quan hệ 1-n bằng cách thêm vào bảng dữ liệu mới. Trong ví dụ trên chúng ta thêm vào bảng InvoiceDetails để tách nó ra thành 02 quan hệ 1-n như sau:
Ở đây bạn sẽ khó hiểu là tách trường nào cho bảng InvoiceDetails, dựa vào đâu. Việc này sẽ được giải thích rõ trong bài chuẩn hóa cơ sở dữ liệu bạn xem thêm nhé.
d. Bổ sung khóa ngoại cho các mối quan hệ
Khi đã xác định xong các mối quan hệ, bạn cần đặt các khóa ngoại vào các bảng bên n trong quan hệ 1-n để tạo liên kết giữa chúng. Lúc này chúng ta có cấu trúc cơ sở dữ liệu như sau:
Bước 5: Chuẩn hóa cơ sở dữ liệu
Bước này giúp bạn xem lại cơ sở dữ liệu vừa thiết kế có đáp ứng được qui định của cơ sở dữ liệu quan hệ hay không. Tuy nhiên, đây là một chủ đề dài nên tôi sẽ tách ra thành một bài riêng, bạn đọc thêm ở bài Chuẩn hóa cơ sở dữ liệu nhé.
Làm thế nào để biết được cơ sở dữ liệu được thiết kế đúng?
Bạn chỉ có thể kết luận cơ sở dữ liệu được thiết kế đúng khi các chức năng của hệ thống cài đặt thành công trên nó. Do vậy, bạn có thể chạy thử (dry run) các chức năng trên cấu trúc cơ sở dữ liệu để kiểm tra thiết kế của nó có phù hợp hay không.
Kết luận
Thiết kế cơ sở dữ liệu là một chủ đề khó, liên quan đến nhiều chủ đề nên bạn cần đọc kỹ và đọc các bài liên quan của chuỗi bài viết này để hiểu rõ hơn về nó. Ngoài ra, bạn cũng cần thực tập thiết kế nhiều cơ sở dữ để có kinh nghiệm thiết kế tốt hơn.
Bài tiếp: Chuẩn hóa cơ sở dữ liệu
Bài trước: Cơ sở dữ liệu là gì? Cơ sở dữ liệu quan hệ là gì?
Nếu bạn có điều gì chưa rõ hoặc thắc mắc bạn có thể để lại bình luận bên dưới tôi sẽ sẵn sàng trao đổi với bạn.