Tableau(タブロー)Prep活用(ピボット+ユニオン編)
はじめに
Tableau(タブロー)のデータクレンジングツール「Tableau Prep」の使い方をご紹介いたします。今回は、クリーニング、ピボット、ユニオン結合機能を使ってデータクレンジングしてみます。
今回データの確認とあるべき姿(データクレンジング後の完成形)を確認する
今回取り扱うデータの特徴は、下記の通りです。日付データが横持ち構造になっております。そして、日付がセル結合されている点です。Excel単体で扱うにはこれでも良いですがTableauツールで扱うにはとても厄介なデータ構造です。このデータをいかにして縦持ち構造にできるかが今回のテーマです。セル結合はいかにもExcelデータらしいですね。なお、縦持ち構造に変換する際、重複するデータ要素に注意ください。
今回データ
今回データのクレンジング後のあるべき姿を定義する
No.列は可視化に特に必要ないので削除しても構いません。
手順)
① 同じデータソースを4つ用意する(それぞれの月ごとにデータを分ける必要があるため)
② ステップを追加。クリーニングを実施する
③ ピボットを追加。商品名部分と日付部分を分解する
④ ②から③の作業を他のデータソースでも同様に繰り返す
⑤ ユニオン結合する
⑥ 出力の追加を設置する
⑦ 出力設定
⑧ 出力結果の確認
① 同じデータソースを4つ用意する(それぞれの月ごとにデータを分ける必要があるため)
*シート名「4月アンケート」とありますが内容はアンケート結果ではないのでご留意ください。
② ステップを追加。クリーニングを実施する
今回は、2018/11/1に関する列(会員ID, 11/1/2018, F4, F5)だけを残してすべてのフィールドを削除する。
次に、下記のようにフィールド名を変更する。会員ID部分の列を「会員ID」に。同様に、数量、金額に該当する列をそれぞれ「数量」「金額」に列名を変更する。
そして、下記の通り、データ要素に含まれている会員ID, 商品名, 数量,金額とNULLを除外する。
除外した結果、下方の赤枠のように3件表示されていれば問題ない。
③ ピボットを追加。商品名部分と日付部分を分解する
④ ②から③の作業を他のデータソースでも同様に繰り返す
⑤ ユニオン結合する
⑥ 出力の追加を設置する
⑦ 出力設定
出力形式は3つ用意されている。
⑧ 出力結果の確認
まとめ
今回は、Tableau Prepでデータクレンジングを試してみました。Tableauが基本とするデータ構造は縦持ち構造です。これをまず理解した上でそれにアジャストさせるにはどういうデータ構造を取るべきかを考えると良いでしょう。そして、重要なことは、あるべき姿(最終形)を少ないデータでビジュアライズしながら事前に定義しておくと良いです。これらを念頭に置きながら、ぜひ、参考にしていただければ幸いです。