こんにちは。ディレクターのむむです。
今回は無相関検定のおはなしです。
もうよくわかんないよ!
統計を勉強するたびにそんな気持ちになりますが、なんとなく「数字を見極める統計入門」を一つずつ読んでいくと、なんとなくわかってきた! という希望が見えてくる気がします。
不思議です。(これが学ぶことの喜び…!)
気を取り直して、無相関検定をするにあたって必要な母集団と標本についてお話していきたいと思います。
無相関検定って?
無相関検定とは、「ある標本の相関係数を求めた際に、その相関係数に意味があるのかどうかを決めること」です。
帰無仮説
数字に意味があるか知るためには差を知ることが必要となり、差を知るには基準が必要ですよね。無相関検定ではまずはじめに、「帰無仮説」という仮定を立てます。
帰無仮説とは母集団の相関係数が0(ゼロ)であると仮定します。
もし、この帰無仮説が否定されれば、その反対である「母集団の相関係数が0(ゼロ)ではない」ということが証明されます。
ちなみに仮説を否定することを「棄却」受け入れることを「採択」と呼びます。
母集団と標本
続いて、無相関検定に必要となる母集団と標本について復習の意味を込め説明していきます。
「母集団」と「標本」いう言葉を覚えていますか?
LIGの統計王こと、ともぞう氏のブログ 「数字からサイトの特徴をつかむための統計学〜はじめの一歩〜」に登場したこの言葉
そう!
母集団…データをとる際に対象となるものすべて
標本…母集団の中から絞り込んだ対象
のことです!
標本数と無相関検定の特徴
相関係数0(ゼロ)の母集団から、20個の標本を取り出した場合の相関係数を調べてみましょう。
大切なことは標本数はたくさん設定すること。
これは何度も繰り返して調べることで精度を増していくためです。
もともとの母集団の相関係数が0(ゼロ)なので、標本集団の相関係数も0(ゼロ)になることが多いはずなのですが、0.1や-0.2といった相関係数も起こりえます。しかし、0.95や-0.9という相関係数はほとんど起こりません。
図でみるとこんな感じです。
横軸は相関係数、縦軸には確率密度(面積を求めると確率になるもの)としています。相関係数の0(ゼロ)周辺に集中していることがよくわかりますね。
まとめ
いかがでしたでしょうか?
統計を学んでいく上で数字の奥深さを実感する日々です。
数字や数式が並ぶとそっと目を閉じたくなりますが、少しずつでも知らないことを覚えていくのはいくつになっても楽しいなぁと感じます。
では本日はこのあたりで失礼します。
またお会いしましょう〜。
LIGはWebサイト制作を支援しています。ご興味のある方は事業ぺージをぜひご覧ください。