Tự động làm sạch với Power Query
Tổng quan Power Query
– Giao diện, thế mạnh, các phiên bản
– Khởi động – kích hoạt Power Query
Kỹ thuật lấy kết nối dữ liệu từ nhiều nguồn khác nhau (kết nối từ nhiều sheet, nhiều file csv, excel, sql..)
– Tạo truy vấn lấy dữ liệu từ file CSV/Text/Bảng excel
– Lấy dữ liệu từ nhiều file csv, nhiều file excel cùng cấu trúc
– Lấy dữ liệu từ các truy vấn sql
– Thiết lập kiểu dữ liệu, thiết lập dữ liệu tùy chỉnh theo cài đặt khu vực thiết lập
– Tải dữ liệu và đưa vào mô hình dữ liệu
Tự động cập nhật thêm mới dữ liệu
– Nối các truy vấn
– Nối tất cả các file trong 1 forder
– Nối các bảng tính excel
Kỹ thuật làm sạch dự liệu trong Power Query
– Sử dụng hàm TRIM và CLEAM
– Tách cột và tách ký tự
– Thay thế giá trị
– Điền giá trị tự động
– Loại bỏ các giá trị trùng nhau
– Gộp các cột
– Lọc dữ liệu
– Các truy vấn tham chiếu
– Unpivot và xoay hướng dữ liệu
Tích hợp dữ liệu từ nhiều bảng
– Gộp các truy vấn sử dụng 1 hoặc nhiều trường tham chiếu chung
– Nhóm và thực hiện các thống kê với phép Tổng, trung bình, lớn nhất, nhỏ nhất, số bản ghi và số bản ghi duy nhất
Thêm cột và hàm với ngôn ngữ M giúp truy vấn dễ dàng hơn
– Đọc và chỉnh sửa ngôn ngữ M
– Chuyển đổi 1 loạt các bước đã chuẩn bị dữ liệu thành 1 hàm. Tái sử dụng lại hàm cho các trường hợp sau
– Chức năng tùy chỉnh gỡ lỗi