推定の技術

エンジニアとして働いていて、実験をすることが沢山ある。仮説を立て、サンプルを用意し、必要な試験をして、データを整える。そんなとき、昔から違和感を覚え、訂正を訴えている事柄を今日は述べたいと思う。

それは、「推定」の技術である。

私の職場でしばしば多くの方がやるのが、

「サンプルの平均値 ≒ 全体の平均値」

とすることである。10個くらいのサンプルから得られた結果を、特に考えなしに平均値(m)をとり、それを(神のみぞ知る)母集団の値とみなし、議論する傾向がある。

サンプルから求めた値が、母集団のそれに対してどれだけズレているか推論する手段を、多くの者が忘れている(or知らない)ため、皆が皆、もやもやした気持ちを押し殺しているのが、よく分かるのである。

しかし、誰もそのことは議題に出さない。自分が知らないから。自分の弱みを見せたくないから。。。

本日は、その違和感に蹴りをつける、簡単な一例を紹介する。実験をされる方は、是非試してみてほしい。

【方法】:推定

① サンプルを適当に用意する。( サンプル数=N。標本数ともいう。 )

② 測定する。

③ サンプルの平均値(m)と標準偏差(s)を求める。

④ 自由度Φを求める。( Φ=N-1) ※

⑤ 推定の予測精度X[%]を決める。

⇒ 推定する平均値(μ)が、どのくらいの確率で当たって欲しいか?

数学的には、95%当たると、その事象は起こるとしている。

⑥ 危険率α(=1-X/100)を求める。

⑦ t分布表において、自由度とαが交わるt値を読み取る。

⑧ 「μ = m±t・s/√(N-1)」に③⑦の数値を代入する。

⇒ (神のみぞ知る)母集団の 平均値μは、「m±t・s/√(N-1)」の間にX[%]の確率である。

推定した値の起こりうる確率 まで提示されれば、その値による判断がスムーズにできる。

「サンプル数が少ないから駄目だー!やっぱり金をかけて全数検査しなくっちゃ!」などと、ハゲ頭にカビの生えたようなことを言わなくていいのである。

もう、何十回も主張し続けているのだが、受け入れられないのが悔しい。日本の統計リテラシーの低さを感じてならない、今日このごろである。

癒やし:鷺という生き物@相模川

水のせせらぎ、身近な生の自然、野生動物、美しい石 に出会うという至福の癒やしを得るために相模川によく行くのですが、野生のカワウの撮影をしていると、すぐ近くに、野生の鷺がやってきました!警戒心の強い鳥なので、こんなに間近で撮影できるのは、本当に珍しいです😊 鋭い嘴、ペリカンの仲間であることにうなずかされる首からお腹のフォルム、野生動物特有の鋭い眼 、、、この出会いに感謝です!