-
Kết nối dữ liệu từ nhiều nguồn
-
Cài đặt Python và R
-
Xử lý làm sạch dữ liệu với Tableau Prep
-
Khám phá Tài nguyên dành cho Nhà phát triển
Hướng dẫn cơ bản
Tài nguyên
Tạo thư mục Sample với các tài nguyên sau:
Tạo thư mục con South |
1. Kết nối với dữ liệu
Điều đầu tiên bạn thấy khi mở Tableau Prep Builder là trang Bắt đầu với ngăn Kết nối , giống như Tableau Desktop.
Thực hiện nối các dữ liệu tại khu vực South
Chọn Union multiple file để nối các file dữ liệu khu vực South
Kéo dữ liệu các vùng còn lại vào flow
Làm sạch dữ liệu
1.Làm sạch dữ liệu cho file order_central
Thêm cột vùng
Thêm cột order Date và Ship Date với hàm makedate(year,month,day)
Xóa các cột thừa về thời gian
Thay thế giá trị None – Sửa dữ liệu cột Discount
Làm sạch bảng Đông Orders_East
chọn remove letter cho cột Sales
Đổi kiểu dữ liệu về số decimal
.làm sạch bảng Tây Orders_West
Sửa thủ công các giá trị tên tại cột tỉnh State
group values >> Manual Selection để đổi mã tỉnh thành tên tỉnh
Danh sách hợp theo nhóm
Abbreviation | State Name |
AZ | Arizona |
CA | California |
CO | Colorado |
ID | Idaho |
MT | Montana |
NM | New Mexico |
NV | Nevada |
OR | Oregon |
UT | Utah |
WA | Washington |
WY | Wyoming |
Hợp nhất dữ liệu
Union 4 nguồn đã làm sạch ở trên
Xem các trường không khớp nhau với show only mismathched fields
Hợp nhất các trường không khớp
Product và product name
Discounts và Discount
Bỏ chọn lại tất cả các trường
Làm sạch lý do trả về return_reasons new
Chỉ chọn 4 cột OrderID, ProductID, Return Reason, Note
Làm sạch Note, loại bỏ các giá trị trống
Tách cột Notes,
Đổi tên các cột mới thành Return Notes và Approver
Xóa bỏ cột Notes ban đầu
Gom nhóm các giá trị giống nhau trong Approver, ở lửa chọn Group values >> Common Characters
Kết nối các nguồn dữ liệu
Nối All Order và Return:
Join giữa 2 trường Order ID và Product ID. Phép nối Left join
Thực hiện làm sạch, xóa bỏ các cột không cần thiết, Order ID, Product_1, Path, table name
Thêm các cột nhận diện trạng thái trả về
Trạng thái = If ISNULL([Return Reason])=FALSE THEN “Yes” ELSE “No” END
Them cột thời gian giao hành
Thời gian = DATEDIFF(‘day’,[Order Date],[Ship Date])
Xuất luồng ra output
Định dạng .hyper
Hoặc .csv nếu làm trong desktop