Tableau(タブロー)バージョン2020.2の新機能-リレーションシップ
リレーションシップとは
リレーションシップとは、バージョン2020.2より新規に追加された、複数テーブルのデータを組み合わせる際に、「動的」にかつ、「直感的」に扱うことができる機能です。より簡単なテーブル結合プロセスを提供した機能といえます。従来のテーブル結合方法である「結合」や「データブレンド」を利用する場面のほとんどで、このリレーションシップが代替できるようになりました。では、代替するメリットはどういったケースでしょうか?今回は、このあたりを中心に解説していきます。
リレーションシップの特徴
- 事前に結合タイプ(内部結合、左外部結合など)を設定する必要がなく、一致するフィールドを選択するだけでOK
- 従来のベン図アイコンは表示されない
- 単一論理テーブルをダブルクリックすると、従来の結合タイプ設定画面が出てくる(例えば、下記の注文をダブルクリックすると従来のベン図アイコンが出現し、従来通りの設定方法が使用可能)
- 結合タイプは、実際にビューに設置されたフィールドによって後付けで自動調整・決定される(動的)。そのため、結合タイプの決定は先送りされる。
- 実際のビジュアライゼーションで使用されているフィールドを持つテーブルに対してのみ、クエリするため、「パフォーマンス」が優れている
- データモデルが二層構造。上位層である論理レイヤーと下位層である物理レイヤー という構造になっている。物理レイヤーでは、従来の結合方法指定が引き続き使用可能。
- 論理レイヤーには、少なくとも、1つの物理テーブルが含まれる。また、論理レイヤーの下位層である物理レイヤーの片方が複数の物理テーブルの結合である場合でも、もう片方の論理レイヤーの下位層の物理レイヤーでは、単一の物理テーブルであっても特に問題ない(下記の物理テーブルBの例)。
https://help.tableau.com/current/pro/desktop/ja-jp/datasource_relationships_learnmorepage.htm より引用
- 詳細レベルが異なる分析で、LOD 式または LOD 計算を使用する必要がない
- ユーザー側できっちりと結合条件を固定させたい場合は、物理レイヤーにて、従来通りの結合方法を指定すれば良い。
参考文献)
‘https://ex-ture.com/blog/2019/11/22/new-data-modeling-relationship/
リレーションシップの挙動
リレーションシップでは、実際のビューで使用するフィールドの設定状況によって結合タイプを自動調整・決定する特性があります。そこで、ここでは、どのようなタイミングでどのような結合タイプとなるかを見ていきます。検証の切り口自体を、下記の書籍を一部参考にさせていただきました。
Tableauによる最適なダッシュボードの作成と最速のデータ分析テクニック ~優れたビジュアル表現と問題解決のヒント~
データーソースA)選手マスタと打撃成績
データーソースB)売上実績と目標予算
(1)2つのデータソースから、それぞれディメンションのみを表示した場合の結合タイプは?
答え. 内部結合が自動設定される
(2)それぞれのデータソースから、「ディメンション」と「メジャー」を配置した場合の結合タイプは?
答え. 完全外部結合が自動設定される
(3)1つのデータソースから、ディメンションとメジャーを、片方のデータソースからディメンションのみを表示した場合の結合タイプは?
答え. 左外部結合または右外部結合が自動設定される。下記は、結果、左外部結合の例。
(4)表示するディメンションよりもメジャーのもつ粒度が粗い場合の計算粒度は?
答え. 4/6の目標予算を複製しつつ、総計は複製前の値で合計(12,000→10,000)
リレーションシップの主な利用シーン
もっともわかりやすい例は、LOD式(ここではFIXED)が不要になる点だと思います。これを、データソースBで検証してみます。
(1)従来バージョン(2019.2.5で試行)
従来バージョンでは、FIXED関数を使わない限り、レプリカユニフォームに対する「目標予算」が重複カウントされてしまいます。これに対応するには、FIXED関数を使用する必要があります。
{FIXED [サブカテゴリ]:MAX([目標予算])}
左外部結合で設定)
目標予算が重複)
データブレンドでも同様に重複計算されてしまう)
FIXEDで対応)
(2)新バージョン(2020.2.2で試行)
新バージョンの場合の設定はこちらです。フィールド指定のみです。
特に、FIXED による計算式利用は不要です。
まとめ
今回は、バージョン2020.2の新機能となります、「リレーションシップ」について触れてみました。コンセプトは、より「直感的」にデータを組み合わせる点にありますが、このコンセプトに慣れないとデータの整合性に対する心理的な不安はかなり大きいかと思います。他方、目標予算でも触れた通り、重複の排除を気にしなくて良いメリットもあります。あまり複雑にならないようなデータの組み合わせにおいてはこちらの新機能を積極的に使うのも良いかと思います。皆さんも、一度、検証してみると良いと思います。
2020.3 Verの新機能について