1. HOME
  2. ブログ
  3. Tableau Prep Builder
  4. Tableau(タブロー)Prep活用(ピボット+ユニオン編)

BLOG

ブログ

Tableau Prep Builder

Tableau(タブロー)Prep活用(ピボット+ユニオン編)

Tableau(タブロー)Prep活用(ピボット+ユニオン編)

 

 

はじめに

Tableau(タブロー)のデータクレンジングツール「Tableau Prep」の使い方をご紹介いたします。今回は、クリーニング、ピボット、ユニオン結合機能を使ってデータクレンジングしてみます。

 

 

今回データの確認とあるべき姿(データクレンジング後の完成形)を確認する

 

今回取り扱うデータの特徴は、下記の通りです。日付データが横持ち構造になっております。そして、日付がセル結合されている点です。Excel単体で扱うにはこれでも良いですがTableauツールで扱うにはとても厄介なデータ構造です。このデータをいかにして縦持ち構造にできるかが今回のテーマです。セル結合はいかにもExcelデータらしいですね。なお、縦持ち構造に変換する際、重複するデータ要素に注意ください。

今回データ 

データダウンロードはこちら

 

今回データのクレンジング後のあるべき姿を定義する

No.列は可視化に特に必要ないので削除しても構いません。

 

 

手順)

① 同じデータソースを4つ用意する(それぞれの月ごとにデータを分ける必要があるため)

② ステップを追加。クリーニングを実施する

③ ピボットを追加。商品名部分と日付部分を分解する

④ ②から③の作業を他のデータソースでも同様に繰り返す

⑤ ユニオン結合する

⑥ 出力の追加を設置する

⑦ 出力設定

⑧ 出力結果の確認

 

 

 

① 同じデータソースを4つ用意する(それぞれの月ごとにデータを分ける必要があるため)

*シート名「4月アンケート」とありますが内容はアンケート結果ではないのでご留意ください。

 

② ステップを追加。クリーニングを実施する

今回は、2018/11/1に関する列(会員ID, 11/1/2018, F4, F5)だけを残してすべてのフィールドを削除する。

 

次に、下記のようにフィールド名を変更する。会員ID部分の列を「会員ID」に。同様に、数量、金額に該当する列をそれぞれ「数量」「金額」に列名を変更する。

 

そして、下記の通り、データ要素に含まれている会員ID, 商品名, 数量,金額とNULLを除外する。

除外した結果、下方の赤枠のように3件表示されていれば問題ない。

 

 

③ ピボットを追加。商品名部分と日付部分を分解する

 

 

④ ②から③の作業を他のデータソースでも同様に繰り返す

 

 

⑤ ユニオン結合する

 

 

⑥ 出力の追加を設置する

 

 

⑦ 出力設定

出力形式は3つ用意されている。

 

 

⑧ 出力結果の確認

 

 

まとめ

今回は、Tableau Prepでデータクレンジングを試してみました。Tableauが基本とするデータ構造は縦持ち構造です。これをまず理解した上でそれにアジャストさせるにはどういうデータ構造を取るべきかを考えると良いでしょう。そして、重要なことは、あるべき姿(最終形)を少ないデータでビジュアライズしながら事前に定義しておくと良いです。これらを念頭に置きながら、ぜひ、参考にしていただければ幸いです。

 

 

 

 

 

関連記事