Thống kê Phân tích dữ liệu lớn với R

Tìm hiểu số liệu thống kê và áp dụng các khái niệm này tại nơi làm việc của bạn bằng R.

Khóa học sẽ dạy cho bạn các khái niệm cơ bản liên quan đến Thống kê và Phân tích dữ liệu, đồng thời giúp bạn áp dụng các khái niệm này. Nhiều ví dụ và bộ dữ liệu khác nhau được sử dụng để giải thích ứng dụng.

Làm dự án phân tích dữ liệu bằng ngôn ngữ lập trình r của Irafali555 | Fiverr

Nội dung

  1. Vài nét cơ bản về R và Rstudio
  • Giao diện và cách cài đặt chạy các ứng dụng đơn giản
  • Quản lý dữ liệu trong R
  • Các kiểu dữ liệu (biến chuỗi, vec tơ) và xử lý chuyển đổi các kiểu dữ liệu trong R
  • Nhập file dữ liệu đầu vào các dạng khác nhau trong R
  • Trích xuất dữ liệu đầu ra trong R

2. Vài nét về Khai phá dữ liệu (quy trình phân tích dữ liệu lớn) với R

  • Vài nét cơ bản về học máy và khai phá dữ liệu
  • Tổng quan về quy trình phân tích dữ liệu (lớn)
  • Ứng dụng học máy phân tích dữ liệu lớn trong các bài toán nghiệp vụ (thống kê)

 

Phân tích mô tả

3. Thống kê mô tả dữ liệu với R

  • Phân tích quan hệ giữa các biến (số lượng quan sát, giá trị đặc biệt, phương sai, độ lệch chuẩn…)

4. Cách thức cơ bản xử lý phân tích dữ liệu lớn

  • Giới thiệu về các câu lệnh điều kiện
  • Cách viết hàm số (function) trong R
  • Kiểm tra và xử lý giá trị khuyết thiếu (missing data)
  • Phát hiện và loại bỏ dữ liệu trùng lặp
  • Cắt và ghép các tập dữ liệu
  • Lọc dữ liệu theo điều kiện
  • Sắp xếp dữ liệu theo thứ tự tăng/giảm dần
  • Chọn biến phân cụm
  • Xây dựng ma trận khoảng cách
  • Chọn phương pháp phân cụm
  • Xác định số lượng và mô tả cụm
  • Đánh giá chất lượng phân cụm

5. Mô phỏng ngẫu nhiên trong R

  • Giới thiệu về mô phỏng ngẫu nhiên trong R
  • Giải một số ví dụ đơn giản bằng mô phỏng

6. Phân tích nhóm và thống kê so sánh nhóm

  • Phân tích so sánh tương quan giữa hai biến
  • Phân tích so sánh tương quan giữa các nhóm biến khác nhau

 

Phân tích chuẩn đóan – dự đoán

7. Phân tích các yếu tố ảnh hưởng đến kết quả: mô hình tuyến tính

  • Hồi quy với dữ liệu chuỗi thời gian
  • Hồi quy với dữ liệu bảng

+ Hồi quy tuyến tính

+ Hồi quy bội

  • Dự báo dự trên hàm xu thế
  • Mô hình dự báo ARIMA, AR, MA, v,v

8. Phân tích nhân tố

  • Phân tích ANOVA
  • Phân tích nhân tố, phân tích thành phần chính

9. Phân tích phân cụm

  • Mô hình phân cụm dữ liệu và ứng dụng

 

10.  Trực quan hóa dữ liệu với các biểu đồ

  • Xây dựng các dạng đồ thị thông dụng: đồ thị cột, đường, tròn,… đồ thị phân tán, đồ thị Histogram
  • Xây dựng map cho dữ liệu không gian (nếu được)
  • Hướng dẫn sử dụng R mark down

 

Để bắt đầu khóa học. Các bạn vui lòng bấm vào ĐĂNG KÝ thông tin học viên để vào lớp học quet ma dang ky:

dangky

2.Các TÀI NGUYÊN cho khóa học gồm:

-Tài liệu thực hành theo buổi học

-Slide bài giảng

-Giáo trình hướng dẫn R

PHÒNG THỰC HÀNH

  1. Đánh giá kết quả khóa học với BÀI KIỂM TRA

 

link zalo lớp

Curriculum is empty

Instructor

User Avatar TokTips

0.0
0 total
5
0
4
0
3
0
2
0
1
0

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *