Scatter Charts, Bubble Charts Và Dot Plot Charts Trong Power Bi
--- Bài mới hơn ---
Scatter charts, bubble charts và Dot Plot là những biểu đồ khá phổ biến trong phân tích dữ liệu. Các biểu đồ này được Power BI cung cấp sẵn và có thể tùy biến dễ dàng cho nhiều mục đích. Bài viết này, sẽ giúp bạn khám phá thông qua các ứng dụng thực tế.
Bài viết bao gồm các nội dung:
Scatter chart luôn luôn có hai trục giá trị để hiển thị: một bộ dữ liệu số dọc theo trục ngang và một bộ giá trị số khác dọc theo trục dọc. Biểu đồ hiển thị các điểm tại giao điểm của giá trị số x và y, kết hợp các giá trị này thành các điểm dữ liệu liệu duy nhất. Power BI có thể phân phối các điểm dữ liệu này đồng đều hoặc không đồng đều trên trục hoành. Điều đó sẽ phụ thuộc vào dữ liệu mà biểu đồ đại diện. Bạn có thể đặt tối đa 10,000 điểm dữ liệu.
1.1. Scatter chart và bubble chart
Kích thước bong bóng sẽ đại diện cho kích thước dữ liệu
Scatter chart biểu thị mối quan hệ giữa 2 giá trị số. Bubble chart thay thế các điểm dữ liệu bằng các bong bóng, với kích thước bong bóng đại diện cho kích thước dữ liệu. Scatter chart thường được dùng trong các trường hợp:
- Biểu diễn mối quan hệ giữa 2 giá trị số.
- Vẽ hai nhóm số dưới dạng một chuỗi tọa độ x và y.
- Sử dụng thay biểu đồ đường khi bạn muốn thay đổi tỷ lệ của trục ngang.
- Cần chuyển trục ngang thành thang đo logarit.
- Hiển thị dữ liệu bảng tính bao gồm các cặp hoặc nhóm giá trị được nhóm.
Lưu ý: Trong Scatter chart, bạn có thể điều chỉnh tỷ lệ độc lập của các trục để tiết lộ thêm thông tin về các giá trị được nhóm.
- Hiển thị các mẫu trong các bộ dữ liệu lớn, ví dụ hiển thị các xu hướng tuyến tính hoặc phi tuyến tính, cụm và ngoại lệ.
- So sánh số lượng lớn các điểm dữ liệu mà không cần quan tâm đến thời gian. Càng nhiều dữ liệu mà bạn đưa vào Scatter chart, thì sự so sánh mà bạn có thể thực hiện càng tốt.
Ngoài những gì mà Scatter chart có thể làm, bubble chart còn mang đến một số ứng dụng khác:
- Khi dữ liệu của bạn có ba chuỗi dữ liệu, mỗi chuỗi chứa một tập hợp các giá trị.
- Trình bày dữ liệu thuộc lĩnh vực tài chính. Kích thước bong bóng khác nhau rất hữu ích để nhấn mạnh trực quan các giá trị cụ thể.
- Sử dụng với góc phần tư.
1.2. Dot plot charts
Dot plot chart thì tương tự như bubble chart và scatter chart nhưng thay vào đó được dùng để vẽ phân loại dữ liệu dọc theo trục X.
Các loại biểu đồ trên là lựa chọn tuyệt vời nếu bạn muốn bao gồm dữ liệu phân loại dọc theo trục X.
1.3. Các bước chuẩn bị:
- Bước 2: Tìm đến tệp mà bạn đã tải về ở trên.
- Bước 3: Mở tệp lên và chọn chế độ xem báo cáo.
- Bước 4: Nhấp vào dấu cộng bên dưới để tạo một trang mới.
- Bước 1: Bắt đầu từ một trang báo cáo trống, từ thanh Fields chọn các fields sau:
Power BI hiển thị một scatter chart mà giá trị Total Sales Variance % dọc theo trục Y và Sales Per Square Feet dọc theo trục X. Màu sắc điểm dữ liệu sẽ đại diện cho các quận.
Bây giờ, chúng ta sẽ thêm vào một dimension thứ ba.
- Bước 2: Rê chuột của bạn qua một bong bóng bất kì. Kích thước của bong bóng sẽ phản chiếu giá trị của This Year Sales.
Bạn có thể đặt khối lượng dữ liệu tối đa là 10,000, khi bạn đặt giá trị cao hơn, hãy thử nghiệm trước để đảm bảo hiệu suất.
Lưu ý: Càng nhiều điểm dữ liệu càng mất nhiều thời gian tải. Nếu bạn chọn publish các reports với giới hạn cao hơn, hãy chắc chắn kiểm tra các reports của bạn trên web và mobile.
- Bước 4: Tiếp tục định dạng màu sắc của trực quan, nhãn (labels), tiêu đề (titles), background (nền)…. Để cải thiện khả năng tiếp cận của biểu đồ, Power BI còn cung cấp tính năng thêm các hình dạng đánh dấu vào mỗi dòng. Để chọn hình, bạn mở rộng dòng Shape, chọn Marker shape và chọn một hình bất kì.
Thay đổi hình dạng đánh dấu thành một hình kim cương (diamond), tam giác (triangle) hoặc hình vuông (square). Việc sử dụng các hình dạng đánh dấu khác nhau cho mỗi dòng giúp báo cáo rõ ràng hơn cho người xem.
- Bước 5: Chọn tab Analytic biểu tượng kính lúp trong khung Visualization và thêm thông tin bổ sung vào trực quan của bạn.
Tiếp theo, chúng ta sẽ thêm biểu tượng đối xứng để chỉ ra điểm nào có giá trị cao hơn của measure trục x so với measure trục y và ngược lại. Khi bạn thay đổi biểu tượng đối xứng trên tab Analytic, Power BI hiển thị cho bạn nền của scatter chart dựa trên các ranh giới trên và dưới của trục hiện tại của bạn. Đây là một cách rất nhanh để xác định measure trục nào ưu tiên điểm dữ liệu, đặc biệt là khi bạn có phạm vi trục khác nhau cho hai trục x và y.
- Thay đổi trường Total sales variance % thành Gross margin last year %
Tiếp tục khám phá tab Analytic để tìm ra những điểm thú vị bên trong dữ liệu của bạn.
Chỉ xuất hiện một điểm dữ liệu bên trong scatter chart
Trường hợp bạn tạo một Scatter chart và chỉ xuất hiện một điểm duy nhất trên biểu đồ, có thể đó là giá trị tổng hợp của tất cả giá trị trên trục X và Y. Một trường hợp khác đó là tổng của tất cả giá trị trên một đường hoặc trục.
Thêm một trường vào ô Details để báo với Power BI cách nhóm các giá trị. Trường phải là duy nhất cho mỗi điểm mà bạn muốn vẽ. Đó có thể là một số hàng hoặc ID của trường.
Nếu không có trường như trên trong dữ liệu của bạn, hãy tạo ra một trường nối các giá trị trên trục X và Y lại với nhau thành một điểm duy nhất cho mỗi điểm.
Để tạo một trường mới trong Power BI, bạn có thể sử dụng Power BI Desktop Query Editor để thêm một Index Column và dataset của bạn. Sau đó, bạn chỉ cần thêm cột này vào ô Detail trong trực quan của mình.
Nhu cầu đào tạo doanh nghiệp
là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của quốc tế. Ngoài các khóa học public, còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
Tham khảo chương trình đào tạo:
BAC – Biên soạn và tổng hợp nội dung
--- Bài cũ hơn ---