※注意)弊社代表の独断と偏見です。
tableau(タブロー)の結合(左結合)を使って、返品率を求めてみた
今回のテーマ
tableau(タブロー)のデータ接続オプションの一つ、結合(左結合)を試してみたいと思います。
あわせて、サンプルデータソースファイルの注文データと返品データを左結合した上で、
カテゴリごとの返品率を算出したいと思います。
◆tableau(タブロー)のデータソース接続方式の4種類について
・結合… データベース内の複数テーブルもしくは、excelの同一ブックの中の複数シートが結合対象
・データブレンド… 異なるデータベースやファイルを結合する
・クロスデータベース結合… 異なるデータベースやファイルを結合する
・ユニオン… 同じ列名を持つ別表から行を追加する
一見すると、データブレンドとクロスデータベース結合は同じように見えますが
下記の点で異なります。
・抽出が必要なソース(Googleアナリティクスなど)がある場合は、データブレンドを使う必要がある
・クロスデータベース結合はデータ統合の結果、行レベルの結合が行われる
・クロスデータベース結合対象リストにないデータソースについては結合できない
・データブレンドはプライマリソースがすべて組み込まれる左結合として機能する
それでは、今回のテーマでもある”結合”についてみていきましょう。
(1)結合方式
今回も付属のサンプルデータソースを活用させていただきます。
ここでは、注文データを左結合として、返品データを結合します。
これにより、返品データがある注文は、注文データと関連づけられます。
注文データは全件が取得対象となります。
[注文].オーダーID = [返品].オーダーID(返品)
(2)返品率を算出する計算式フィールドを作成します
ここでは、返品数の定義を、返品フラグがたったレコード数とします。
返品数 = 返品フラグレコード数
その場合の返品率を下記とします。
返品率 = 返品数 / 全レコード
(3)カテゴリ単位での返品率の算出例
上記のように、全体のオーダーIDカウント([注文].オーダーID)数のうち、
返品数([返品].オーダーID(返品))の割合が算出できました。
仮に、内部結合方式を実施した場合は、下記の結果となります。
内部結合方式では、返品レコードがあるデータだけに絞られるため、
返品率は100%となります。
◆まとめ
今回は、注文データと返品データの左結合を利用して、返品率を求めてみました。
結合は、同じデータソース内の複数のデータを統合するために利用できます。
基本的なところですので、ぜひ、利活用してみてください。
tableauについてはこちらの参考書も便利です!
tableau(タブロー)の使い方、導入でお困りごとはございませんか??
ぜひ、弊社へ気軽にご相談くださいませ。きっと、お役に立てると思います。
[contact-form-7 id=”1357″ title=”tableau問い合わせ”]