Phân tích thông tin các khoá học trực tuyến EDX

TẢI BỘ DỮ LIỆU EXD tại đây

Bộ dữ liệu cung cấp các thông tin sau

– course_id: Mã định danh duy nhất cho khóa học.
– Course Short Title: Tên viết tắt hoặc tên rút gọn của khóa học.
– Course Long Title: Tên đầy đủ của khóa học.
– userid_DI: Mã định danh duy nhất của người học (đã được ẩn danh).
– registered: Người học đã đăng ký khóa học (đúng/sai hoặc 1/0).
– viewed: Người học đã từng vào xem nội dung khóa học.
– explored: Người học đã tham gia học (ví dụ: xem nhiều phần nội dung hơn).
– certified: Người học đã hoàn thành và nhận chứng chỉ.
– Country: Quốc gia của người học.
– LoE_DI: Trình độ học vấn (Level of Education), có thể là đã tốt nghiệp đại học, trung học, v.v.
– YoB: Năm sinh của người học (Year of Birth).
– Age: Tuổi (thường được tính từ năm sinh).
– gender: Giới tính.
– grade: Điểm tổng kết hoặc điểm trung bình đạt được trong khóa học.
– start_time_DI: Thời điểm người học bắt đầu học.
– last_event_DI: Lần tương tác cuối cùng của người học (xem video, làm bài, v.v.).
– nevents: Tổng số sự kiện/tương tác của người học (ví dụ: số lượt nhấp, hoạt động).
– ndays_act: Số ngày mà người học có hoạt động trong khóa học.
– nplay_video: Số lần người học phát video bài giảng.
– nchapters: Số chương (module) đã được người học xem qua.
– nforum_posts: Số bài viết trong diễn đàn khóa học.
– roles: Vai trò của người học (ví dụ: học viên, trợ giảng, giáo viên…).
– incomplete_flag: Cờ đánh dấu nếu dữ liệu không đầy đủ hoặc người học bỏ dở.
Thực hiện một số phân tích sau:
1. Tổng quan người học
– Số lượng người đăng ký, đã xem, đã học, và đã được chứng nhận.
– Tỷ lệ hoàn thành (certified / registered).
– Sự phân bổ theo giới tính, độ tuổi, quốc gia, trình độ học vấn (LoE_DI).
 2. Phân tích hành vi học tập
– Trung bình số video đã xem (nplay_video) theo từng nhóm: viewed, explored, certified.
– Phân tích tương quan giữa số ngày hoạt động (ndays_act) và điểm số (grade).
– Xem liệu người học xem càng nhiều chương (nchapters) thì có điểm cao hơn không.
3. Phân tích hiệu quả học tập
– So sánh grade giữa các nhóm: giới tính, trình độ học vấn, quốc gia, v.v.
– Xem người học có vai trò đặc biệt (ví dụ trợ giảng) có khác biệt trong tương tác và điểm số không.
– Phân tích mối liên hệ giữa thời điểm bắt đầu học (start_time_DI) và kết quả đạt được.
4. Phân tích rủi ro bỏ học
– Dự đoán khả năng bỏ học bằng cách phân tích người học có incomplete_flag = 1:
– Họ có hoạt động ít hơn?
– Có vào học muộn không?
– Số tương tác với video, chương, diễn đàn thấp?

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *