Các học viên sẽ được trang bị kiến thức chung về phương pháp, quy trình phân tích dữ liệu dựa trên máy học và khai phá dữ liệu hiện đại, tại sao và làm thế nào để thực hiện quy trình từ mức độ tổng thể tới chi tiết. Học viên sẽ được học các kỹ thuật, công cụ để giải quyết các vấn đề đa dạng của phân tích dữ liệu, bao gồm việc thu thập và tạo lập dữ liệu, phân tích mô tả dữ liệu, tiền xử lý dữ liệu, xây dựng mô hình, đánh giá và kiểm định mô hình, triển khai mô hình trong thực tế. Các chủ đề này sẽ không đi quá sâu vào cơ sở lý thuyết mà hướng đến việc làm chủ các khái niệm bằng thực hành, giúp học viên nhanh chóng nắm bắt vấn đề, có khả năng áp dụng kiến thức vào giải quyết công việc thực tế.
Thời lượng: 4 ngày
Khóa học bao gồm:
- Tổng quan về quy trình phân tích dữ liệu trong và ứng dụng trong các bài toán nghiệp vụ
- Các công cụ thực hiện phân tích dữ liệu hiện đại
- Kiến thức nền tảng về học máy và khai phá dữ liệu, đặc biệt là các thuật toán hỗ trợ phân tích, dự báo
- Các kỹ thuật cơ bản mô hình hóa dữ liệu
- Sử dụng R và RStudio để xây dựng một hệ thống phân tích dự báo
Nội dung khóa học
Ngày 1:
Tổng quan về quy trình phân tích dữ liệu
- Tổng quan về quy trình phân tích dữ liệu
- Xu hướng tiếp cận hiện đại trong phân tích dữ liệu
- Ứng dụng phân tích dữ liệu trong các bài toán nghiệp vụ
- Giới thiệu về học máy và khai phá dữ liệu
- Cơ bản về ngôn ngữ R và Rstudio
Thống kê mô tả dữ liệu
- Các kiến thức cơ bản về thống kê dùng trong phân tích dữ liệu
- Trực quan hóa dữ liệu với các biểu đồ
- Biến đổi dữ liệu
- Phân tích quan hệ giữa các biến
Ngày 2:
Phân tích nhóm và thống kê so sánh nhóm
- Phân tích sự khác biệt giữa các nhóm
- Các kỹ thuật kiểm định giả thuyết thống kê
- Phân tích ANOVA
Ngày 3:
Phân tích các yếu tố ảnh hưởng đến kết quả: mô hình tuyến tính
- Mô hình hồi quy tuyến tính và ứng dụng
- Luận giải, đánh giá và so sánh các mô hình
- Cải tiến mô hình
- Mô hình tuyến tính nâng cao: đa cộng tuyến và cách khắc phục, mô hình hồi quy logistic và ứng dụng
- Thực hành xây dựng một ứng dụng dự báo
Ngày 4:
Phân tích nhân tố và Phân tích phân cụm
- Phân tích nhân tố, phân tích thành phần chính
- Mô hình phân cụm dữ liệu và ứng dụng
- Ứng dụng phân tích phân khúc khách hàng
- Tổng kết khóa học