-
Giới thiệu chung
-
Kỹ thuật xử lý làm sạch dữ liệu với Power Query
-
Mô Hình dữ liệu và ngôn ngữ DAX
-
Trực quan hoá dữ liệu
-
Phân tích dữ liệu
-
Cộng tác - chia sẻ - bảo mật
-
Bài toán theo đơn vị
Phân tích thông tin các khoá học trực tuyến EDX
TẢI BỘ DỮ LIỆU EXD tại đây
Bộ dữ liệu cung cấp các thông tin sau
– course_id: Mã định danh duy nhất cho khóa học.
– Course Short Title: Tên viết tắt hoặc tên rút gọn của khóa học.
– Course Long Title: Tên đầy đủ của khóa học.
– userid_DI: Mã định danh duy nhất của người học (đã được ẩn danh).
– registered: Người học đã đăng ký khóa học (đúng/sai hoặc 1/0).
– viewed: Người học đã từng vào xem nội dung khóa học.
– explored: Người học đã tham gia học (ví dụ: xem nhiều phần nội dung hơn).
– certified: Người học đã hoàn thành và nhận chứng chỉ.
– Country: Quốc gia của người học.
– LoE_DI: Trình độ học vấn (Level of Education), có thể là đã tốt nghiệp đại học, trung học, v.v.
– YoB: Năm sinh của người học (Year of Birth).
– Age: Tuổi (thường được tính từ năm sinh).
– gender: Giới tính.
– grade: Điểm tổng kết hoặc điểm trung bình đạt được trong khóa học.
– start_time_DI: Thời điểm người học bắt đầu học.
– last_event_DI: Lần tương tác cuối cùng của người học (xem video, làm bài, v.v.).
– nevents: Tổng số sự kiện/tương tác của người học (ví dụ: số lượt nhấp, hoạt động).
– ndays_act: Số ngày mà người học có hoạt động trong khóa học.
– nplay_video: Số lần người học phát video bài giảng.
– nchapters: Số chương (module) đã được người học xem qua.
– nforum_posts: Số bài viết trong diễn đàn khóa học.
– roles: Vai trò của người học (ví dụ: học viên, trợ giảng, giáo viên…).
– incomplete_flag: Cờ đánh dấu nếu dữ liệu không đầy đủ hoặc người học bỏ dở.
Thực hiện một số phân tích sau:
1. Tổng quan người học
– Số lượng người đăng ký, đã xem, đã học, và đã được chứng nhận.
– Tỷ lệ hoàn thành (certified / registered).
– Sự phân bổ theo giới tính, độ tuổi, quốc gia, trình độ học vấn (LoE_DI).
2. Phân tích hành vi học tập
– Trung bình số video đã xem (nplay_video) theo từng nhóm: viewed, explored, certified.
– Phân tích tương quan giữa số ngày hoạt động (ndays_act) và điểm số (grade).
– Xem liệu người học xem càng nhiều chương (nchapters) thì có điểm cao hơn không.
3. Phân tích hiệu quả học tập
– So sánh grade giữa các nhóm: giới tính, trình độ học vấn, quốc gia, v.v.
– Xem người học có vai trò đặc biệt (ví dụ trợ giảng) có khác biệt trong tương tác và điểm số không.
– Phân tích mối liên hệ giữa thời điểm bắt đầu học (start_time_DI) và kết quả đạt được.
4. Phân tích rủi ro bỏ học
– Dự đoán khả năng bỏ học bằng cách phân tích người học có incomplete_flag = 1:
– Họ có hoạt động ít hơn?
– Có vào học muộn không?
– Số tương tác với video, chương, diễn đàn thấp?
Prev
Chia sẻ và cộng tác