平均は悪か?
本日は、「単純平均」の扱い方について触れてみます。
一般的に「平均」は実態を隠すと揶揄されることがあります。確かに、扱いずらい側面があることは事実です。
そこで、今回は、その理由について、検証してみます。
まずは、単純平均(算術平均・相加平均)を調べる
今回扱うデータソースはこちらです。*データはデタラメな数値を使っております。
まずは、単純平均を出してみます。
性別で見た場合、女性よりも男性の方が「売上平均」は1000万程度、優位といえるでしょう。
一見すると、この男性と女性の間に大きな「差」があります。
これは紛れもない事実です。
しかし、だからといって男性が「優位」という結論になってしまうのでしょうか。
つぎに、分布状況を確認してみましょう
つぎに、階級幅を10歳刻みとする年齢の階級(ビン)を作成して、性別ごとに分布状況をみてみましょう。
*スタックは解除しております。
*通常は、ヒストグラムを使ってください。
ほとんどの階級で重なっており、すべての階級で先述したような大きな「差」は認められません。
さらに、細かいセグメントで分布状況を確認してみましょう
さらにカテゴリで分解してみましょう。さらに隠れていた実態が見えてきました。ゴルフ関連カテゴリはほぼ重なり合っております。他方、野球関連は、40歳以降の階級幅で「差」が大きくなったといえます。
なお、合計の割合でみると下記のようになります。
まとめ
今回は、単純平均(算術平均・相加平均)を扱ってみました。
「平均は実態を隠す」という点が理解できたかと思います。この点を理解すれば、「平均」を正しく処理することができると思います。ぜひ、参考にしてみてください。
余談ですが、正しく平均が扱え、分布状況を正しく確認でき、結果、統計的には正しい実態を把握できて改善策を導いたとしてもなお、ビジネス的には「不正解」であるといった現象が実際の現場では起こります。なぜならば、ビジネスに最も重要な「信頼」の度合いは必ずしもこれらの数値にすべて反映されるとは限らないためです。むしろ、反映されないことも多いです。この辺りを過信し数値偏向に寄りすぎるとビジネスの行き先をしばらくの間、見失ってしまうことになります。ビジネスは時としてナマモノですので注意が必要です。