-
Chương 1: CÁC KHÁI NIỆM CƠ BẢN
Các khái niệm cơ bản
-
Chương 2: MÔ HÌNH THỰC THỂ LIÊN KẾT
Mô hình thực thể liên kết
-
Chương 3: MÔ HÌNH CƠ SỞ DỮ LIỆU QUAN HỆ
Mô hình cơ sở dữ liệu quan hệ
-
Chương 4: ĐẠI SỐ QUAN HỆ
Các phép toán trên dữ liệu
-
Chương 5: RÀNG BUỘC TOÀN VẸN
-
Chương 6: PHỤ THUỘC HÀM
-
Chương 7: CHUẨN HÓA CƠ SỞ DỮ LIỆU
1.4. Mô hình CSDL
Mô hình dữ liệu
1 Kiến trúc của cơ sở dữ liệu
Một cơ sở dữ liệu đươc mô tả theo 3 mức trừu tượng khác nhau phụ thuộc vào đối tượng nghiên cứu và sử dụng cơ sở dữ liệu : Mức vật lý, mức khái niệm và mức khung nhìn.
Cơ sở dữ liệu mức vật lý
Một tập hợp các file (bảng) dữ liệu, các chỉ mục hoặc những cấu trúc khác dùng để lưu trữ và truy xuất dữ liệu một cách hiệu quả gọi là cơ sở dữ liệu mức vật lý. Cơ sở dữ liệu mức vật lý tồn tại thường xuyên trong các thiết bị lưu trữ (như đĩa từ, băng từ,..).
Cơ sở dữ liệu mức khái niệm
Cơ sở dữ liệu mức khai niệm là một một sự trừu tượng hóa của thế giới thực với mục đích mô tả cơ sở dữ liệu trong quá trình nghiên cứu, thiết kế cơ sở dữ liệu. Các Hệ quản trị cơ sở dữ liệu cung cấp ngôn ngữ định nghĩa dữ liệu (Data Definition Language – DDL) để mô tả cơ sở dữ liệu mức khái niệm và ngôn ngữ thao tác dữ liệu trên cơ sở dữ liệu mức khái niệm (Data Manipulation Language).
Cơ sở dữ liệu mức vật lý là sự cài đặt cụ thể của cơ sở dữ liệu mức khái niệm.
Cơ sở dữ liệu mức khung nhìn
Khung nhìn (View) hay lược đồ con (SubScheme) là một phần của cơ sở dữ liệu khái niệm hoặc trừu tượng hóa một phần của sơ sở dữ liệu mức khái niệm. Đây là cách nhìn của người sử dụng đối với cơ sở dữ liệu.
Hầu hêt các hệ quản trị cơ sở dữ liệu đều cung cấp những phương tiện để khai báo khung nhìn được gọi là ngôn ngữ định nghĩa dữ liệu lược đồ con (Subscheme Data Definition Language) và các phương tiện để diễn đạt các câu truy vấn, thao tác dữ liệu lược đồ con (Subscheme Data Manipulation Language).
Các khung nhìn có vai trò quan trọng trong việc bảo mật hệ thống cơ sở dữ liệu, chỉ những người có nhu cầu và quyền hạn mới có thể đọc được các file dữ liệu dành cho họ.
2 Mô hình dữ liệu
- Khái niệm mô hình dữ liệu
Mô hình dữ liệu (Data Model) là tập hợp các khái niệm dùng để mô tả cấu trúc của một hệ cơ sở dữ liệu. Cấu trúc hệ cơ sở dữ liệu bao gồm kiểu dữ liệu, các quan hệ, và các ràng buộc có thể có của dữ liệu. Hầu hết các mô hình dữ liệu đều kèm theo các thao tác cơ sở dành cho việc tìm kiếm cơ bản và cập nhật dữ liệu, ngoài ra các mô hình dữ liệu còn cho phép người sử dụng tự định nghĩa thêm các thao tác mới.
Như vậy để có thể mô tả các hệ cơ sở dữ liệu trong quá trình thiết kế chúng ta cần sử dụng các mô hình dữ liệu.
Mỗi mô hình dữ liệu đều có mục đính riêng của mình. Các mô hình dữ liệu được phân loại dựa trên cơ sở những khái niệm của mô hình dùng để mô tả cấu trúc của cơ sở dữ liệu.
Mô hình dữ liệu có thể hiểu là hệ hình thức toán học gồm có hai phần:
– Một hệ thống các ký hiệu để mô tả dữ liệu
– Một tập hợp các phép toán thao tác trên dữ liệu đó.
Mô hình dữ liệu khi được xây dựng dựa vào một số đặc trưng:
– Tính ổn định khi thiết kế mô hình dữ liệu
– Tính đơn giản: dễ hiểu và dễ thao tác
– Tính dư thừa phải kiểm tra kỹ càng
– Cơ sở lý thuyết vững chắc
Dựa trên mục đích sử dụng người phân loại mô hình dữ liệu thành 3 dạng:
Mô hình dữ liệu mức ngoài: dùng để mô tả cơ sở dữ liệu cho người sử dụng.
Mô hình dữ liệu mức quan niệm đưa ra các khái niệm mô tả cơ sở dữ liệu mức khái niệm, Mô hình dữ liệu mức quan niệm là cách nhìn dữ liệu một cách tổng quát của người sử dụng. Nghĩa là có rất nhiều cách nhìn dữ liệu ở mô hình ngoài, nhưng chỉ có duy nhất một cách nhìn dữ liệu ở mức quan niệm. Và việc biểu diễn toàn bộ thông tin trong cơ sở dữ liệu là duy nhất.
Mô hình dữ liệu mức vật lý dùng mô tả cơ sở dữ liệu mức vật lý bao gồm chi tiết cách thức lưu trữ dữ liệu trên máy tính, các khái niệm trong mô hình dữ liệu mức vật lý có ý nghĩa với các đặc trưng của máy tính chứ không dành cho người sử dụng.
Ý nghĩa của mô hình dữ liệu
Việc thiết kế cơ sở dữ liệu được thực hiện đơn giản hơn nhiều khi ta sử dụng các mô hình. Các mô hình là sự trừu tượng đơn giản của các sự kiện trong thế giới thực. Một mô hình cơ sở dữ liệu là một tập hợp các khái niệm dùng để biểu diễn các cấu trúc của cơ sở dữ liệu. Cấu trúc của một cơ sở dữ liệu là các kiểu dữ liệu, các mối liên kết và các ràng buộc phải tuân theo trên các dữ liệu. Một số mô hình còn có thêm một tập hợp các phép toán cơ bản để đặc tả thao tác trên cơ sở dữ liệu.
Khi thiết kế mô hình nếu thiết kế tốt sẽ đưa ra các cơ sở dữ liệu tốt và trên cơ sở đó sẽ có các ứng dụng tốt. Ngược lại, mô hình không tốt sẽ đưa đến thiết kế cơ sở dữ liệu tồi và dẫn đến các ứng dụng không đúng.
Mô hình dữ liệu được xác định bởi một sơ đồ dữ liệu mô tả của nhiều kiểu thực thể, chẳng hạn như kiểu thực thể sinh viên, giáo viên, môn học, … Sơ đồ dữ liệu bao gồm các định nghĩa về các kiểu bản ghi, đó là các ràng buộc cho quyền và tính toàn vẹn thích hợp. Những ràng buộc này chính là các tính chất của dữ liệu, tính liên kết các thuộc tính cùng một kiểu dữ liệu. Các định nghĩa này không bao hàm về cấu trúc lưu trữ, cũng như về chiến lược truy nhập, chúng chỉ là các định nghĩa về nội dung thông tin, về tính độc lập của dữ liệu trong mô hình quan niệm.
-
Khái niệm lược đồ (Scheme) và thể hiện (Instance)
Ngoài việc phân chia các mức trừu tượng như trên, chúng ta còn một cách hiểu khác về tính hai mặt của cơ sở dữ liệu đó là lược đồ và thể hiện. Khi thiết kế cơ sở dữ liệu người ta quan tâm đến những hoạch định và cấu trúc trên cơ sở dữ liệu, điều đó được biểu diễn thông qua lược đồ của cơ sở dữ liệu; nhưng khi sử dụng người ta lại quan tâm đến dữ liệu thực sự tồn tại trong cơ sở dư liệu, đó là thể hiện của cơ sở dữ liệu.
Lược đồ dữ liệu thường được sử dụng để biểu diễn cơ sở dữ liệu mức khái niệm, thông qua các khái niệm của mô hình dữ liệu quan niệm. Điều đó tạo ra sự ổn định của sơ đồ dữ liệu vì mô hình quan niệm luôn ổn định. Nếu lược đồ dữ liệu không ổn định thì các ứng dụng và mô hình ngoài cũng không ổn định. Lược đồ dữ liệu chỉ được thay đổi khi có sự điều chỉnh trong thế giới thực, đòi hỏi điều chỉnh lại định nghĩa sao cho phản ánh đúng và chính xác so với thực tế hơn.
3 Một số mô hình dữ liệu
-
Mô hình thực thể liên kết (Entity Relationship Model – ER): Là mô hình cho phép mô tả các thực thể thông qua các thuộc tính và mối liên hệ giữa các thực thể.
-
Mô hình cơ sở dữ liệu quan hệ
Mô hình dữ liệu quan hệ do E.F. Codd đề xuất. Nền tảng cơ bản của mô hình cơ sở dữ liệu quan hệ là khái niệm lý thuyết tập hợp trên các quan hệ, tức là tập các bộ giá trị.
Mô hình này tiến hành biểu thị dữ liệu trong một CSDL như một tập các quan hệ và một quan hệ là một bảng các giá trị gồm các dòng và các cột
3. Mô hình dữ liệu mạng
Mô hình dữ liệu mạng (hay còn gọi là mô hình lưới) là mô hình được biểu diễn bởi một đồ thị có hướng.
Các thành phần trong mô hình dữ liệu mạng:
– Loại mẫu tin (Record Type): là mẫu đặc trưng cho từng loại đối tượng riêng biệt, được biểu diễn bởi một hình chữ nhật.
– Mẫu tin hay bản ghi (Record): là thể hiện cụ thể của loại mẫu tin
– Loại liên hệ (Set Type): là sự liên kết giữa một loại mẫu tin chủ với một loại mẫu tin thành viên, được biểu diễn bởi một hình bầu dục. Trong loại liên hệ, cần chỉ ra số lượng các mẫu tin tham gia trong mỗi kết hợp. Các loại liên hệ: 1-1: mỗi mẫu tin của mẫu tin chủ chỉ kết hợp với đúng một mẫu tin thành viên; 1-n; n-1; Đệ quy: một loại mẫu tin chủ cũng có thể đồng thời là loại mẫu tin thành viên với chính nó.
Sự liên kết giữa 2 loại mẫu tin được thể hiện bởi các cung có hướng đi từ loại mẫu tin chủ tới loại liên hệ và từ loại liên hệ tới loại mẫu tin thành viên.
4. Mô hình dữ liệu phân cấp:
Mô hình dữ liệu phân cấp là một cây (Tree) trong đó mỗi nút của cây biểu diễn một thực thể, giữa nút con và nút cha được liên hệ với nhau theo một mối quan hệ xác định.
Trong mô hình phân cấp, loại mẫu tin được mô tả giống trong mô hình mạng. Loại liên hệ: Kiểu liên hệ là phân cấp, theo cách: Mẫu tin thành viên chỉ đóng vai trò thành viên của một mối liên hệ duy nhất, tức là thuộc một chủ duy nhất.
Như vậy, mối liên hệ từ mẫu tin chủ tới các mẫu tin thành viên là 1-n, và từ mẫu tin thành viên tới mẫu tin chủ là 1-1.
Giữa hai loại mẫu tin chỉ tồn tại một mối liên hệ duy nhất
5. Mô hình dữ liệu hướng đối tượng
Hiện nay, mô hình dữ liệu hướng đối tượng là loại mô hình tiên tiến nhất hiện nay, dựa trên cách tiếp cận hướng đối tượng. Trong mô hình này sử dụng các khái niệm như lớp, sự kế thừa, kế thừa bội…
Phương pháp tiếp cận này còn mới mẻ và các hệ quản trị CSDL hướng đối tượng hiện nay vẫn chưa nhiều và chưa thuần nhất
6.Mô hình dữ liệu kho dữ liệu
Kho dữ liệu hay được viết là Data Warehouse. Kho dữ liệu là một tập các dữ liệu có những đặt điểm sau: Tập trung vào một chủ đề, tổng hợp từ nhiều nguồn dữ liệu khác nhau, từ nhiều thời gian, và không sửa đổi.
Thông thường mô hình kho dữ liệu được dùng trong việc hỗ trợ ra quyết định trong công tác quản lý.