相関と因果関係の間に混乱をクリア 

あなたが気づいていない歴史的なお菓子があります。 1860と1940の間で、ニューイングランドに住むメソジスト閣僚の数が増えるにつれて、ボストンに輸入されたキューバのラムの量も増え、両者は非常に似た方法で増加した。 したがって、メソジスト閣僚は、その期間にたくさんのラムを購入したに違いない!

実際には、それは愚かな結論です。 実際に起こっていることは、メソジスト閣僚とキューバラムの両方の量が、人口増加などの他の要因によって上方に押し上げられたことです。

その誤った結論に達するにあたり、私たちは 因果関係と混乱の相関関係.

何が違うのか?

2つの量は 相関  (「正相関」)、または他方が減少する場合に増加する(「負に相関する」)場合には、

相関は容易の統計的測定によって検出されます ピアソンの相関係数1(完全に負の相関関係にある)から0(全く相関していない)から1(完全に正の相関関係にある)までの2つの量がどの程度密接にロックされているかを示す。


インナーセルフ購読グラフィック


 因果関係tylervigen.com

しかし、2つの量が相関しているという理由だけで、必ずしも直接的なものではない 原因 もう一方は変更する。 相関は因果関係を意味しないたとえその逆が真実であっても、曇った天気が降雨を意味しないのと同じように、

2つの量が相関している場合、本物の因果関係(降雨量や傘販売など)があるかもしれませんが、おそらく他の変数が 海賊の数字と地球温暖化)、あるいはそれはちょうど偶然のことです(例えば 米国のチーズの消費とstrangulations-by-bedsheet).

因果関係が存在する場合でも、我々は効果と原因を混同しないように注意する必要があり、さもなければ我々はヒーターの使用の増加は、寒い天候を引き起こすこと、例えば、結論かもしれません。

原因と結果を確立するために、我々は統計を超えて、(科学的、歴史的な性質の)独立した証拠と論理的な推論を検索する必要があります。 相関は最初の場所でそのような証拠を探しに行くために私たちを促すことができるが、それは決してそれ自体で証拠です。

微妙な問題

上記の例は明らかに愚かであったが、相関関係は、非常に多くの場合、現実の世界ではすぐには明らかにされない方法で、因果関係のために間違っています。 彼らが何であるか、より重要なことと - 読書と統計を解釈すると、1は、データとその統計が暗示されている正確に理解するために細心の注意を払う必要があります 暗黙のうちに。

 因果関係

データの解釈には注意の必要性の一つの最近の例では、見かけの画期的を取り巻く今年初めに興奮です 重力波の検出 - 作成されたように見える発表 時期尚早データに影響を与えていたすべての変数が説明される前に、

残念ながら、統計、確率とリスクを分析することは、私たちに配線スキルセットではありません 人間の直感、そしてすべてがあまりにも容易に迷子になることはありません。 全書籍 統計が誤解される(または誤解を招く)微妙な方法で書かれています。 ガードを維持するために、次の点に注意する必要がある一般的な滑りやすい統計的な問題があります。

1)ヘルシーワーカー効果。レベル競技場で2つのグループを直接比較できないことがあります。

オフィス労働者のグループの健康状態と宇宙飛行士の健康状態を比較した仮説的な検討を考えてみましょう。 この研究が健康と作業環境の間に相関関係がない2つの間に有意差がないとすれば、宇宙での生活や仕事は宇宙飛行士にとって長期的な健康上のリスクを伴わないと結論づけていますか?

いいえ! グループは同じ立場にはない:宇宙飛行士のスクリーンの応募者は健全な候補者を見つけ、「微小重力」での生活の影響に積極的に対処するために包括的なフィットネス体制を維持する。

したがって、彼らは平均して事務員よりも有意に健康的であると予想し、そうでない場合は心配する必要があります。

2)分類とステージマイグレーション効果 - グループ間で人をシャッフルすることは、統計結果に劇的な影響を与える可能性があります。

これは、 ウィル·ロジャース 伝えられるところによると、米国のコメディアンの後で、

Okiesはオクラホマ州を離れ、カリフォルニアに移動すると、彼らは両方の状態での平均的な知能レベルを上げました。

説明するために、大きなグループの友人を「短い」グループと「高い」グループに分けて(おそらくそれらを写真のために並べるために)想像してください。 そうすることで、両方のグループの平均身長を同時に上げることは驚くほど簡単です。

「背の高い」グループの最短人に「短い」グループに切り替えるように依頼するだけです。 「背の高い」グループは最短のメンバーを失って平均的な身長を上げますが、「短いグループ」はまだ高いメンバーを獲得しており、平均的な身長も上がります。

これは、新しい治療を試験する過程で患者がしばしば「健康な」または「不健全な」グループに分類される医学研究に大きな影響を与えます。 診断方法が改善されれば、非常にわずかに不健康な患者の一部が再分類される可能性があり、治療がどれほど有効であるか否かにかかわらず、両群の健康成果が改善する。

 因果関係データの中から選択して選択すると、間違った結論につながる可能性があります。 懐疑派は、データが実際に長期的な温暖化(緑色)を示しているときに、冷却期間(青色)を見る。 skepticalscience.com 

3)データマイニング - データの豊富さが存在する場合、こまごまとは、任意の所望の結論をサポートするために、チェリー摘みすることができます。

これは悪い統計的練習ですが、 意図的に行われた場合 オリジナルの完全なデータセットを知らなくても見つけにくい場合があります。

例えば、地球温暖化データの2つの解釈を示す上のグラフを考えてみましょう。 またはフッ化物 - 少量でそれは歴史的に最も効果的な予防薬の一つですが、毒性のある量のフッ化物しか考慮していないと、正の効果は完全に消滅します。

同様の理由から、与えられた統計的実験の手順は、実験が開始される前に固定され、実験が終了するまで変わらないことが重要である。

4)クラスタリング - 完全にランダムなデータでも期待される。

癌や多発性硬化症などの特定の疾患がどのようにしてどのように 地理的に分散した。 病気がランダムに(そして環境に影響を与えないで)襲うならば、私たちはもちろん、患者の多数の群を見ることが期待されます。 患者が完全に均等に広がっている場合、分布は実際にはほとんどランダムではありません。

したがって、単一のクラスター、またはいくつかの小さなクラスターの存在は、完全に正常です。 その領域の何かが病気を引き起こしている可能性があると推測するためにどれくらいのクラスタリングが必要であるかを判断するためには洗練された統計的方法が必要です。

残念なことに、どんなクラスタでも、重要ではないものであっても、簡単に(そして一目瞭然に、魅力的な)ニュースの見出しになります。

 因果関係

統計分析は、他の強力なツールと同様に、非常に慎重に使用する必要があります。特に、2つの数量が相関しているという事実に基づいて結論を導くときは常に注意する必要があります。

代わりに、私たちは常に因果関係を主張する別々の証拠を主張しなければなりません。その証拠は単一の統計番号の形ではないでしょう。

明らかに強い相関関係、例えば与えられた遺伝子と 統合失調症 または間 高脂肪食 非常に疑わしい方法論に基づいていることが判明する可能性があります。

我々はおそらく、これらの問題に対処するために認知症種として準備されています。 カナダの教育者として キリアン・イーガン 彼の本に入れて 初めから間違っている:

悪い知らせは、私たちの進化が私たちに小型で安定した狩猟採集会に住むことができたということです。 私たちは更新世の人々ですが、私たちの衰えた脳は、私たちが住むために大規模で、多文化で、技術的に洗練され、急速に変化する社会を作り出しました。

結果として、私たちは絶えず偶然の意味を見て、相関と因果関係を混同する誘惑に常に抵抗しなければなりません。会話

この記事は、最初に公開された 会話
読む 原著.


著者について

ジョナサンborweinJonathan Borwein(Jon)は、ニューキャッスル大学で数学の受賞教授を務めています。 彼はニューキャッスル大学の数学者受賞教授であり、コンピュータ支援研究数学とその応用センター(CARMA)のディレクターです。 彼はCarnegie-Melon、Dalhousie、Simon Fraser、Waterlooの各大学に勤務しており、コンピューティングでは2人のカナダ研究チェアを抱えています。

ローズマイケルマイケルローズは、ニューキャッスル大学の数学博士課程の博士号取得者であり、オーストラリアのニューキャッスル大学のジョンボルワイン賞受賞者の監督を受けています。 現在、脳シナプス分布のモデリングにフラクタル数学を適用する研究を支援しています。

開示書: 著者は、この記事の恩恵を受ける企業や組織のために働いたり、相談したり、株式を所有したり、資金を受け取ったりすることはありません。 また、関連する提携関係はありません。


推奨書籍:

お金、セックス、戦争、カルマ:仏教革命のための注意事項
David R. Loy著

お金、セックス、戦争、カルマ:デヴィッド・R.・ロイによって仏教革命のための注意事項。デビッド・ロイは、現代世界の社会政治的景観を変革する能力を他の誰のように説明する、仏教世界観の最も強力な主張者の1人になっています。 に お金、セックス、戦争、カルマ彼はカルマの働き、自己の性質、個人的および社会的レベルでのトラブルの原因、そして「決して十分ではない」という集団的な感覚の背後にある本当の理由の、誤解されていない仏教の重要なプレゼンテーションを鋭く、 "それは時間、お金、セックス、セキュリティ、さらには戦争であるかどうか。 ダビデの「仏教革命」は、私たちの生活、地球、言語、文化、さらにはスピリチュアリティに満ちた集団妄想に近づく方法の根本的な変化であるにすぎません。

詳細はこちら、そして/または、Amazonで本を注文する。