7 TRỤC QUẢN TRỊ DỮ LIỆU THIẾT YẾU
Xây dựng nền tảng vững chắc cho việc khai thác tài sản dữ liệu trong doanh nghiệp hiện đại.
⚖️ 1. Quản Trị Dữ Liệu
Thiết lập nền tảng, chính sách, quyền sở hữu và quy tắc sử dụng dữ liệu trong toàn tổ chức để đảm bảo tính nhất quán và trách nhiệm.
Ví dụ với MySQL:
Tạo vai trò người dùng và cấp quyền cụ thể trên các bảng dữ liệu.
GRANT SELECT, UPDATE ON sales.customers TO 'data_steward'@'%';
✅ 2. Chất Lượng Dữ Liệu
Đảm bảo dữ liệu luôn chính xác, đầy đủ, nhất quán và đáng tin cậy thông qua các quy trình kiểm tra và làm sạch.
Tỷ lệ Lỗi Dữ liệu theo Loại
Ví dụ với MySQL:
Sử dụng ràng buộc `CHECK` để đảm bảo giá sản phẩm luôn là số dương.
ALTER TABLE products ADD CONSTRAINT chk_price CHECK (price > 0);
🏗️ 3. Kiến Trúc & Mô Hình
Cung cấp cấu trúc và kế hoạch chi tiết cho việc tổ chức, lưu trữ và quan hệ giữa các thực thể dữ liệu.
Ví dụ với MySQL:
Thiết kế bảng `users` và `orders` với khóa ngoại để thể hiện mối quan-hệ một-nhiều.
id (PK)
name
id (PK)
user_id (FK)
🛡️ 4. Bảo Mật & Riêng Tư
Bảo vệ thông tin nhạy cảm khỏi truy cập trái phép và đảm bảo tuân thủ các quy định pháp luật về quyền riêng tư dữ liệu.
Mức Độ Hiệu Quả Của Các Biện Pháp Bảo Mật
Ví dụ với MySQL:
Cấp quyền xem trên các cột cụ thể, che giấu thông tin nhạy cảm.
GRANT SELECT(id, name) ON crm.clients TO 'marketing'@'%';
🔖 5. Quản Lý Siêu Dữ Liệu
Cung cấp ngữ cảnh, định nghĩa, và “dữ liệu về dữ liệu” để giúp người dùng hiểu rõ hơn về ý nghĩa và cách sử dụng thông tin.
Mức Độ Hoàn Thiện Siêu Dữ Liệu
Ví dụ với MySQL:
Truy vấn `INFORMATION_SCHEMA` để lấy thông tin về cấu trúc bảng.
SELECT COLUMN_NAME, DATA_TYPE FROM INFORMATION_SCHEMA.COLUMNS;
🔗 6. Tích Hợp & Lưu Trữ
Hợp nhất dữ liệu từ nhiều nguồn khác nhau vào một nơi lưu trữ tập trung, giúp việc truy cập và phân tích trở nên dễ dàng.
Luồng Tích Hợp Dữ Liệu
👤 7. Quản Lý Dữ Liệu (Stewardship)
Vai trò thiết yếu của những người chịu trách nhiệm giám sát, quản lý và bảo vệ chất lượng của một tập hợp dữ liệu cụ thể.
Số Lượng Sự Cố Dữ Liệu Được Giải Quyết (Hàng Quý)