分析して、数字も出しました。けれども、その読み方を一つ間違えただけで、打ち手はまるごと的を外します。「訪問回数が多い営業ほど受注が多い」というデータを見て、全員に訪問を増やさせたら、かえって受注が落ちてしまう。よかれと思った施策が空振りどころか逆効果になり、現場からは「言われた通りにやったのに」と不信の目を向けられます。データ分析を任された方から、わたしたちはこうした苦い経験をよく聞きます。

分析でいちばん怖いのは、計算ミスではありません。数字は正しいのに、読み方を誤ることです。しかも解釈の誤りは、本人が気づきにくい。自信を持って間違えます。やっかいなことに、よくある落とし穴はだいたい決まっています。まず代表的な4つを早見表で押さえてください。自分の分析がどれに引っかかりそうかが見えてきます。

落とし穴ありがちな誤り対処の一言
相関と因果一緒に動く=原因と決めつける「他に原因はないか」を問う
平均の罠平均だけ見て実態を見落とす分布・中央値も見る
外れ値極端な値に全体が引っ張られる極端な数件を分けて見る
母数の見落とし割合の分母を確かめない「何件中か」を必ず添える

ここからは4つを1つずつ、なぜ間違えるのか、どう見分け、どう対処するかを、実例つきで見ていきます。

相関と因果を取り違えない

最も多く、最も高くつく誤りがこれです。2つの数字が一緒に動く(相関)ことと、片方がもう片方を引き起こす(因果)ことは、別物です。一緒に動いているからといって、片方を増やせばもう片方も増える、とは限りません。

冒頭の例がまさにこれです。「訪問回数が多い営業ほど受注が多い」。ここから「全員、訪問を増やせ」と動くと、たいてい空振りします。実態は逆で、もともと受注しやすい有望な客に、営業が多く足を運んでいただけ、ということがあるからです。この場合、訪問回数と受注のどちらも「客の有望さ」という第三の要因に引っ張られています。これを見落とすと、原因を取り違えます。

見分けるには、3つを自問します。第一に、逆ではないか(受注しやすい客だから訪問が増えたのでは)。第二に、両方を動かす別の原因はないか(客の有望さ、季節、キャンペーン)。第三に、偶然ではないか。怪しいと感じたら、条件をそろえて比べ直します。たとえば「有望さが同じくらいの客」だけを取り出して、訪問回数と受注の関係を見る。それでも関係が残れば、因果の可能性が高まります。

見えた関係早合点の結論疑うべき別の説明
訪問が多い営業ほど受注が多い訪問を増やせば受注が増える有望な客に多く訪問しているだけ
広告費が多い月ほど売上が高い広告を増やせば売れる繁忙期に広告も売上も増えるだけ
研修を受けた人ほど成績が良い研修が成績を上げるもともと優秀な人が研修に出ている

相関は、原因の「あたり」をつけるには有効です。けれども、それだけで打ち手の根拠にはしません。気になる関係が見つかったら、別の説明を一通り潰してから動きます。

平均の罠:平均は実態を隠す

平均は便利ですが、実態を平らにならして隠します。「平均すると問題ない」が、いちばん危ない言葉です。

たとえば「顧客の平均満足度は3.5点(5点満点)」。まずまずに見えます。けれども中身を見ると、5点が半分、1点が半分で、平均が3.5になっていることがあります。これは「おおむね満足」ではなく、「熱狂的なファンと、強い不満が、二つに割れている」状態です。打ち手はまるで変わります。平均だけ見ていたら、半分の不満客を見落とします。

対処は、平均と一緒に「ばらつき」を見ることです。最高と最低の幅、点数ごとの人数(分布)、そして中央値です。中央値は、小さい順に並べてちょうど真ん中の値で、極端な値に引っ張られにくい指標です。平均と中央値が大きくずれていたら、分布が偏っているサインです。一度ヒストグラム(点数ごとの件数の棒グラフ)にすると、二つに割れているのか、片寄っているのかがひと目で分かります。

見るもの分かること
平均全体のおおよその水準
中央値極端な値に左右されない真ん中
分布(ヒストグラム)偏り・二極化の有無
最大・最小の幅ばらつきの大きさ

外れ値:極端な数件に全体が引っ張られる

外れ値は、ほかと比べて極端に大きい・小さい値です。これが数件あるだけで、平均も合計も大きく動き、全体像をゆがめます。

たとえば「今月の平均受注額が急に跳ね上がった」。喜ぶ前に中身を見ると、たまたま1件だけ桁違いに大きな案件があり、それが平均を押し上げていた、ということがあります。残りの案件は普段通り。この1件を「いつものこと」として施策の前提に置くと、来月から計画が狂います。逆に、極端に小さい値(入力ミスや返品)が平均を下げていることもあります。

対処は、まず外れ値があるかを確かめることです。数字を大きい順・小さい順に並べ、飛び抜けた値がないかを見ます。見つかったら、それを除いた場合と含めた場合の両方を出し、結論が変わるかを確かめます。大事なのは、外れ値を勝手に消さないことです。なぜその値が出たのか(大型案件なのか、入力ミスなのか)を確かめ、意味のある値なら分けて扱い、ミスなら直します。「平均」と「外れ値を除いた平均」を並べて見せると、実態が正しく伝わります。

母数の見落とし:割合は「何件中か」で意味が変わる

割合(パーセント)は分かりやすい反面、分母を見落とすと簡単に誤解を生みます。「成約率50%」と聞くと優秀に見えますが、2件中1件なのか、200件中100件なのかで、信頼度はまるで違います。

たとえば「新サービスの解約率が3%で、旧サービスは5%。新サービスのほうが優秀だ」。けれども新サービスは契約30件、旧サービスは契約2,000件だとしたら、新サービスの3%はわずか1件。たまたまかもしれず、まだ優劣を語れる段階ではありません。件数が少ない割合は、ブレが大きく、当てになりません。

対処はシンプルです。割合には必ず「何件中か」を添えます。「成約率50%(2件中1件)」のように分母を併記すれば、読み手が信頼度を判断できます。母数が小さいうちは、割合だけで結論を出さず、件数が貯まるまで判断を保留します。会議資料でも、パーセントの隣に実数を置く癖をつけると、誤読がぐっと減ります。

見せ方読み手の受け取り
成約率50%優秀そう(実は2件中1件かも)
成約率50%(2件中1件)まだ判断できないと分かる
成約率50%(200件中100件)安定して高いと分かる

誤読を防ぐ、3つの口ぐせ

4つの落とし穴は、難しい知識がなくても、3つの問いを習慣にするだけでかなり防げます。分析結果を前にして、毎回これを自分に問いかけてください。

  • 「他に原因はないか?」:相関を見たら、逆向き・第三の要因・偶然を疑います。
  • 「平均の裏で、何が起きているか?」:分布・中央値・外れ値を確かめます。
  • 「これは何件中の話か?」:割合には必ず分母を添えます。

この3つを口ぐせにするだけで、自信満々の誤読がぐっと減ります。分析の型そのものは分析の4つの型に、全体の進め方はデータ分析の進め方にまとめています。

まとめ

  • 分析で怖いのは計算ミスより解釈の誤り。本人が気づきにくい。
  • 相関と因果を取り違えない。別の説明を潰してから打ち手に進む。
  • 平均は実態を隠す。分布・中央値・外れ値もあわせて見る。
  • 割合には必ず「何件中か」を添える。母数が小さいうちは判断を保留。

まずは手元の分析を1つ、「他に原因はないか」「何件中の話か」で見直してみてください。それだけで結論が変わることがあります。分析結果の読み方や打ち手への落とし方を一緒に確かめたいときは、DE-STKの初回スポット相談を壁打ち相手に使っていただけたらうれしいです。一人で「これで合っているか」と抱える前に、気軽に声をかけてください。

よくある質問(FAQ)

Q. 相関と因果は、結局どう見分ければいいですか?

A. 完全に見分けるのは専門家でも難しいですが、実務では「逆向きではないか」「両方を動かす第三の要因はないか」を問うだけで多くの早合点を防げます。怪しければ、条件をそろえた相手だけで比べ直し、それでも関係が残るかを確かめます。

Q. 外れ値は消してしまっていいですか?

A. 勝手に消すのは禁物です。まずなぜその値が出たかを確かめます。大型案件のように意味のある値なら、分けて扱います。入力ミスや返品なら、直すか除きます。いずれにせよ「含めた場合」と「除いた場合」の両方を見て、結論が変わるかを確認します。

Q. 平均と中央値は、どう使い分けますか?

A. 分布が偏っていたり外れ値があったりするときは、中央値のほうが実態に近くなります。平均と中央値が大きくずれていたら、偏りのサインです。両方を並べて見て、ずれが小さければ平均で、大きければ中央値や分布も添えて語ると誤解が減ります。