analytics
Giới thiệu tổng quan về Phân tích dữ liệu
lightbulb
Khái niệm Phân tích dữ liệu (Data Analysis)
Là quá trình kiểm tra, làm sạch, chuyển đổi và mô hình hóa dữ liệu với mục tiêu khám phá thông tin hữu ích, đưa ra kết luận và hỗ trợ ra quyết định. Giúp “nhìn thấy và hiểu dữ liệu trong vài phút”.
category
Phân loại Phân tích dữ liệu
- Mô tả (Descriptive): Trả lời câu hỏi “Điều gì đã xảy ra?”.
- Chẩn đoán (Diagnostic): Trả lời câu hỏi “Tại sao điều đó xảy ra?”.
- Dự đoán (Predictive): Trả lời câu hỏi “Điều gì sẽ xảy ra?”.
- Đề xuất (Prescriptive): Trả lời câu hỏi “Chúng ta nên làm gì?”.
data_object
Đối tượng làm việc
Dữ liệu thô →
Dữ liệu sạch →
Thông tin →
Tri thức
timeline
Quy trình Phân tích dữ liệu
- Thu thập (Collection): Tập hợp dữ liệu từ các nguồn khác nhau.
- Làm sạch (Cleaning): Xử lý dữ liệu thiếu, trùng lặp, không chính xác.
- Khám phá (Exploration): Tìm kiếm các mẫu, xu hướng trong dữ liệu.
- Mô hình hóa (Modeling): Xây dựng các mô hình thống kê hoặc máy học.
- Trực quan hóa (Visualization): Biểu diễn dữ liệu bằng biểu đồ, đồ thị.
- Báo cáo (Reporting): Trình bày kết quả và đề xuất.