Excelによる回帰分析の方法②~相関係数の出し方~

前々回、「Ecelによる回帰分析の方法」として、グラフから簡単な傾向をExcelで読むとる方法を紹介した。その時、「やり方が正しいのであって、答えが正しいかどうかは別である」と述べ、回帰分析を使う際の注意点を述べた。今回は、相関係数を出力して、その値から回帰分析をする価値があるかどうかを判断する方法を紹介する。傾向を調べようとしているデータ間に相関があるといえれば、回帰分析によって得られたグラフも、一定の信頼性があると考えるからである。さすれば、「回帰分析によって得られた関数なんぞ、信用できねーよ!」などという輩にも科学的に釘をさすことができるし、自分も無駄な分析をしなくてすむ。是非、習得して有益な分析をできるようにしましょう。

相関係数とは?

データ間の相関の強さを表す量です。0~1の間の数で、1に近づくほど相関が強いことになります。

数学では、0.7以上を明確に相関度があるという指標にしております。よって、相関を調べたいデータがあった場合、まず、相関係数が0.7以上あるかどうかを見て、回帰分析をしてみてください。

Excelで相関係数を出力する方法とは?

まず、準備としてExcelの「分析ツール」を使えるようにする必要がある。下記の手順に従って、設定しましょう。

「ファイル」→「オプション」→「アドイン」→「分析ツール」→「OK」

以上により、Excel上で「分析ツール」が使えるようになる。早速、リボン上の「データ」→「データ分析」→「相関」→「OK」を押して、下図のようなコマンドが出ることを確認しましょう。

例えば、以前示した、下記のデータの相関係数を出力させてみます。

先ほどの手順で、「相関」を「OK」すると上図の右側のようなコマンドが出ます。その入力範囲に、データの数値の箇所のみドラッグして入れてください。すると、下記のようなデータが出力されます。

上図の0.77796というのが、データ間の相関係数です。0.7以上なので有意な相関があるといえます。上図の列1と列1は、最大輝度のデータ同士の相関係数です。同じ値を比較しているので、1がでるのは当たり前です。列2と列2は、価格[円]のデータ同士を比較しているので同じく1が出て当然です。

このようにして、回帰分析するかどうか、したものが信頼できるものかどうか心配な場合は、是非、相関係数を出力してみて下さい。そして、0.7以上なら、数学的に意味のあるデータとして自信をもって使ってください。

なお、この後、欲しい量とその他複数のデータの間で回帰分析を行う、「重回帰分析」を紹介します。その際、鍵となるのが、複数のデータの選び方です。このとき、使用する方法こそが、「相関」です。是非、物にしてください。

まとめ

・回帰分析するデータの信頼性が心配ならば、データ間の相関を調べましょう。

・相関は、Excelのデータ分析を使って、相関係数にて判定しましょう。

・相関係数≧0.7 かどうかが重要です。

・重回帰分析の際の、パラメータの選定は、相関係数の良い順に行うので、ここでモノにしましょう。

学ぶとき、作るときに言ってはならない言葉

勉強するとき、創造するときに言ってはならない言葉がある。それは「難しい」である。

難しいという言葉は、何か困難にぶち当たったときに口にする。

しかし、勉強しているときや、物を作るときに、それは言ってはならない。

なぜなら、「難しい」と口にすることを一つの答えにしてしまい、分析や前進が止まってしまうからである。また、難しさを理解したところで有益なことは何もない。むしろ、恐怖心をもってしまい、何度学習しても身につかなくなる。以下、数学問題、議論、物作りにおいて、「難しい」と言いそうになった場合の、私の試みをあげる。

数学の問題と考えてみる。

まず、最終的に問われている「〇〇を求めよ」を知る。ここで、難しいと分かったところで、何も得られることはない。ゴールが分かったら、そこに向かうために何が必要か分析をするのである。分析とは、必要と思われる要素を書き出し、一つ一つ点検する作業である。樹形図をイメージするとよい。

要素の書き出しは、如何に多くの問題に触れたかが鍵となる。よって、何かの試験に臨むものは、多くの問題に触れ、「引き出し」を沢山身に着けることが肝要である。

また、処理能力を高めるために、「計算力」と「判断力」を養うこと大事である。

計算力とは、四則演算、微分積分、因数分解、そろばん、暗算etc

判断力とは、「〇か✖かを、ある基準で判定すること」である。ある基準は、自分で定める。この能力は、自分で何かを決める意識や癖を持つだけで日々養える。

これらは、筋トレと同じく、やればやっただけ身につく。

二つ目の例として、「議論」をあげる。これは、議題に対して、意見を言い合い、二項対立を探す。そして、それについて意見を言い合い、感情的でなく客観的な判断を積み重ねて、結論を導く。

この時、AとBという対立意見があったときに、Aの主張者が、Bの主張者にその欠点を指摘されて「難しい」と言ってしまったら、どうなるであろうか?それは、Aという主張は、Bの主張者の突っ込みへの解がないことを意味する。

議論なれしている者ならば、その欠点を保留にしつつ、すかさずBの主張の欠点も述べ、欠点の多少、欠点の質を列挙しあう方向に誘導し、直近の問題に対して数と質のどれで対応するかを判断するように議論を導くであろう。こうしなければ、Aの主張は消えてしまうからである。

最後に、エンジニアとして物を作るときのことをあげる。設計という仕事は、楽しい反面、孤独で責任の重い仕事である。特に機構設計の仕事は、回路設計、ソフト設計に比べて、要求事項も、時間もお金も莫大にかかり、社会的責任の重さも比較にならないほど重たい仕事である。

開発の上流下流の不具合、社会情勢、販売戦略に伴う急な設計変更など日常茶飯事である。「難しい」議題しかないのである。こうしたとき、難しいと言っているだけでは、何も生まれない。まずは、冷静に、その場でできることを列挙するのである。ネットで調べてもよい、書籍から引っ張てきてもよい、開発メンバーでもよい、とにかく出来る方法をあげるのである。

このとき、よくコストや日程が成り立ってないなら、✖ と頭ごなしに言う人がいるが、そんな意見は、たとえ上司でも真に受けてはいけない。コストや日程が成り立つ方法が思いつくなら、とっくに提示しているからである。それがその時間で導いた答え(限界)なのである。

✖といって、日程をくれるのなら再考する。くれないなら、お金と日程を犠牲にしてでもやるしかない。製品において、品質悪が最もよくないことだからである。

以上、「難しい」という言葉の無意味さと、問題・議論・物作りの現場でそう言いたくなる状況を仮想し、私がどのように日常立ち向かっているかを述べた。参考にするとともに、何かアドバイスがあれば、連絡いただきたい。

まとめ

・学びと創造の場では、「難しい」という言葉は、無意味である。

・難しいと言いたくなったら、なぜ難しいのか考え、書き出しましょう。

・書き出した項目について、考えられる解を考えましょう。

熱設計の基本

電気製品の開発において、製品を所望の温度内に抑えることは極めて重要なことである。例えば、スマートフォンで動画を見ていたら熱くてやけどした!なんてことがあったら大問題である。そこで、機構設計者は、スマートフォン内の熱源が安全な温度になるように適切な機構を考えるのである。では、具体的にはどうすればよいのであろうか?今日は、それを少しお話ししたいと思う。

そもそも熱って何?

熱が熱が!というが、そもそも熱って何であろうか?

熱は、エネルギーである。温度は、その測定点でのエネルギー量を感覚的に捉えやすい値で示した物である。

エネルギーという概念でくくれば、光、振動、電気と熱は本質的には同じ物である。したがって、新発電方式、振動軽減、騒音対策などのトピックが出てくると、着目している現象に対して一見別の要素が出てくるのは、皆、エネルギー形態で結ばれているからである。

話を元に戻す。熱はエネルギーである。したがって、機構設計者は、作ろうとしている製品の内部に、どれくらいのエネルギーを発生する物が搭載されるのかを把握し、処理する方法を考えなければならないのである。

熱の処理の仕方 (熱の移動形態)

熱を処理するとは、エネルギーを移動させることを意味する。熱としてのエネルギーの移動のさせ方は、下記の三種類のいずれかの方法で行う。

① 熱伝導:熱源に冷たい固体をくっつけて、熱を冷たい方へ直接移動させる。

② 熱伝達:熱源の周囲の流体(空気など)を動かし、熱を流体へ移動させる。

③ 熱放射:熱を電磁波で移動させる。

①は、熱いものに触れると熱い!という現象そのものである。沸騰したヤカンに手が触れると、ヤカンのもつ大量の熱エネルギーが、その接触面からいっきに手に移動しようとするので、熱い!(痛い)と感じる。

②は、出来たてのラーメンの麺をフーフーして冷ましてから食べるという現象である。麺の熱エネルギーを、空気で吹き飛ばして下げているのである。

③は、焚火や暖炉のそばは温かいという現象を表したものである。物体が熱をもつとその熱は物体表面から電磁波によって放射される。

熱の処理の仕方 (理論手法基礎)

熱の移動形態は基本的には三種類しかない。よって、それぞれを数式で扱えれば、あとはその組み合わせで理論的に熱処理を考えることができる。

例えば、作ろうとしている製品の発する熱エネルギー(発熱量)はこのぐらいであり、製品サイズをこのくらいにすれば表面から熱放射でこのくらいの熱を放熱できる。よって、ファン(=熱源に風を吹き付けたり、空間を換気させる装置)はいらないなな!どという具合に判断できるのである。

下記に、まず、三つの伝熱現象に関係する係数を紹介し、次に関係式を示す。

三つの熱移動現象に関係する係数

・熱伝導率α [W・m/m^2・K]

・熱伝達率β[W/m^2・K]

・ステファンボルツマン係数γ:5.67×10^(-8)[W/m^2・K^4
・放射率ε:物体固有の電磁波を出す率。(ex. 皮膚0.9, 樹脂0.6~0.8, 金属0.1)

これらを使って、各熱の移動形態でどのくらいの熱を移動させられるのかを数式で示した物が下記である。

【熱伝導】

【熱伝達】

【熱放射】


これらが基本である。まだまだ知識としては不十分だが、一例として下記のように、熱伝達率を仮置きすれば、ざっくりと設計対象のサイズを見積ることができる。

【例】

・部品から発するエネルギー(発熱量):10W
・部品使用環境:35℃

のとき、部品の表面温度を仕様書に記載のある上限温度85℃にするには、放熱面積Sをどのくらいにすればよいか?

熱伝達の基本式より、

  • P=10W

発熱量Pは、電子部品なら、入出力電力の差が発熱量である。光源部品なら、入力電力から光出力と出力電力を引いたものが発熱量になる。それぞれの部品の仕様書に書いてあるのでしっかり見ていただきたい。

  • ΔT = 85-35 -10 = 40K

通常、使用環境で部品上限温度にならないように5~10℃ほど低めになるように設計する。ここでは、85℃より10℃低い、75℃を目標温度とした。

  • β=5.0W/m^2K

熱伝達率は、風の当て方、層流や乱流、物体の形状でも変わってくるが、ここでは、大体15W/m2Kほどはあるとする。( この辺は、経験による感覚です。 )

すると、S=P/(β・ΔT)より、S=10/(15×40)=0.016m^2=16,000mm^2 の放熱面積が必要だと分かる。

この情報から、機構設計者は、50mm角でフィン長50mm、ピッチが1mm くらいのヒートシンクが必要かな…と考えるのである。

※ 上記のヒートシンクの放熱面積は16,000mm^2 である。

次回は、熱伝達率のもう少し詳しい説明と、他の伝熱現象を組み合わせて現象を予測する方法を述べたいと思う。

Excelによる回帰分析の方法 ~基本的な手法~

回帰分析というのをご存知であろうか?これは、二つの量の関係性を分析する手法である。手法としては、今現在、人類が見つけている最も効率的な方法論である。比べる量が三つ以上ある場合は、重回帰分析という。今日は、Excelで簡単に回帰分析する手法を紹介する。身近な現象、実験に使ってみてほしい。

Excelでどうやるのか?

例えば、下記のようなデータがあったとする

これは、某R社のプロジェクターの輝度と販売価格を表にしたものである。データは、価格.com ( 2019/2現在 )のデータを元にした。例えば、あなたが、R社の競合会社の企画者であったとして、「明るさ(輝度)と販売費用の関係」を知るにはどうすればよいだろうか?

こうしたときに、結果の正当性はいったん置いといて、人類の見つけた最善の手法が回帰分析である。

まず、Excelを立ち上げ、上表を打ち込む。そして、表題から表の下端まで、下図のようにマウスでドラッグする。

次に、Excelのリボン(コマンドの上側に出ている部分)において、「挿入」を選ぶ。

この「挿入」の中の中央に、グラフという項目があり、下図の赤丸箇所をクリックする。

すると、下図のようなグラフが出力される。これを散布図という。

この時、横軸が表の左側、縦軸が同右側である。解析の際は、縦軸と横軸を明確にすることは極めて重要なので、記載しておく。やり方は、グラフ上にマウスのカーソルを持っていくと下図のように「十字」「ペン」「ジョウロマーク?」みたいなものが右上に出てくる。その十字(赤丸)をクリックする。

すると、下図のように「グラフ要素」が出てくるので、「軸ラベル」に印を入れる。

すると、下図のようになる。

ラベルのところをマウスでクリックし、要素名を記入する。

ここで、回帰直線を引く。これは、各点からの距離和が最小になるように引かれた直線である。人類が複数の点間を通る線の引き方として見つけ、定めた、最善の方法である。これに対して否定できる人は、今のところいません。(数学者ですらできていないから)

やり方は、上図において点のどれかにカーソルを合わせてクリックする。

そして、マウスをその場で右クリックし、「近似曲線の追加」を選択、クリックする。

グラフの点線が、回帰直線である。後は、この直線を表す関数が分かれば、「輝度と価格」の関係が予測できたことになる。やり方が正しいのであって、予測精度などの結果が現実に正しいかどうかは、別の話である。

さて、やり方は、上図の回帰直線を先ほどと同じく、クリックする。出てきた小コマンドの「近似曲線の書式設定」をクリックする。すると、Excelの右側に新たなコマンドが現れる。

そして、右下の赤で囲った箇所「グラフに数式を表示する」にチェックを入れる。そうすると、グラフ上に、数式が表示される。これが、データから回帰分析によって得られた、輝度と価格の関係である。


この後、さらなる分析やディスカッションを経て、この予測が使えそうだと合意ができたら、Excelで下図のようなフォーマットを作っておくと、何かと便利である。

入力の空欄(=セルI20)は、今後、好きな輝度を数値で入力する箇所である。

出力の空欄(=セルI21)には、先ほど求めた回帰直線の数式を記入する。

先ほどのグラフ上の数式におけるXは、最大輝度の入力値である。上図の場合、最大輝度を入力する箇所はセルI20なので、Xの箇所にI20と記述する。

例えば、最大輝度7,000lmのプロジェクターを企画することになったとき、販売価格はどのくらいを想定すればよいか?と思ったとき、上のフォーマットに7,000と入力すると、

という具合になる。

この結果が、予測結果として十分かどうかは、別途議論が必要である。

例えば、この予測では、2,000lmなどは価格がマイナスに出てしまう。この場合は、データ収集箇所を変えてみたり、近似曲線の直線ではなく他の関数を選んでみたり、比較するデータ自体を変えたり、別の要素を追加したり(=重回帰分析)など、まだまだ手は沢山あるので、今後少しづつ紹介していく。

まずは、手持ちのデータから何か語れ!予測しろ!と言われたときに行う、最も一般的な科学的手法を紹介した。是非色々使ってみてほしい。

まとめ

・二つのデータから関係性を求める最も一般的な手法が回帰分析である。

・データ⇒散布図作成⇒近似曲線(回帰直線)作成⇒数式表示 (⇒ 入出力フォーマット作成)

・やり方が正しいのであって、結果が正しいことを保証するものではない。

 式ができたらテスト、現実にそぐわない場合は、前提を見直そう。

電気の基礎

日本では、高校生の頃から理科の授業で、電気に関する現象を扱う。クーロンの法則、ガウスの法則、コンデンサー、フレミングの法則(左/右)、電気回路、電子回路などは、頭を悩ませた記憶があるのではないだろうか?私は、高校時代に何度も赤点を取りました。笑 しかし、一念発起し、一つ一つ丁寧に学んでいくことで、気が付けば最も得意な科目になっておりました。本ブログでは、今後、定期的に基礎電気磁気学と基礎電気回路、電子回路を紹介していきたいと思います。

電気って何?

電気とは、電荷[C]の動きによって起こる現象のことです。例えば、おもむろに金属製のドアノブに触れたときにバチッとなることがあると思います。あれは、体内に溜まっていた電荷が、金属のドアノブが近づき、そこに移動することでおこる現象です。このとき、バチッと感じたり、ビリッと感じたり、感じ方に大小があると思います。これを感覚的に表現していたら現象を客観的に捉えられないがないので、定量的に表現できるように定義した量が、電荷です。

学問的な体系は?

電気の存在は、古代より知られていました。例えば、よく教科書に書かれているのは、琥珀をこすると鳥の羽毛が引き寄せられる現象です。古代ギリシャの記録文の中に登場したりしています。

日本では、江戸時代に平賀源内が壊れたオランダ製の静電気発生装置(エレキテル)を修復して使えるようにし、人々を驚かしたという記述があります。

電気現象が学問として躍進したのは、18世紀に入ってからです。まず、クーロン(仏)が電荷間に働く力の関係性を見つけました(クーロンの法則)。その後、ガウス(独)が、面に拡張して電界(電場)として整理しました(ガウスの法則)。

この時、電気と似た現象である磁界も、学問の基本的な視点である「等価性」から電界に対比させる形で定義と整理をされてきました。その際、磁荷、磁気クーロンの法則、ガウスの法則の磁界バージョンであるビオサバールの法則が作られました。

今までお話ししたことは、全て静止した電荷や磁荷と、その周囲に作られる力の強さ(=電界、磁界)、位置エネルギー(=電位、ポテンシャル)の話です。また、電界や磁界は互いに似ていると分かっていても、どのように関係しているのかは分かりませんでした。そんなときに登場したのが、アンペール(仏)です。彼は、配線に電流を流すと、その周囲においた方位磁針が動く という現象を発見し、その定式化に成功しました(アンペールの法則 )。電流は、電荷の時間変化です。つまり、電荷の変化と磁界の関係を整理することに成功したわけです。いわば、動電界の記述の成功です。

この後、ファラデー(英)が、レンツ-ファラデーの電磁誘導の法則を発表します。これは、コイルに磁石を出し入れして磁界の大きさを変えてやると、流れる電流値が変わるというものです。数式としては、磁束の変化に対して電位が変わるという形で整理されております。こうして、動磁界の記述に成功しました。

19世紀に入り、マクスウェル(英)が光や電磁波の研究の中で、光は電磁波であることをファラデーまでの理論で記述することに成功しました。これが、有名なマクスウェルの方程式です。大学で物理を専攻すると、必ず電気磁気学の講座があります。このとき、全体像を理解させて細部の理論を教えてくださる先生方は、まず、マクスウェルの方程式を黒板に書きます。しかし、私の経験上さっぱり分からなかったので、ここでは、数式を語る前に、背景を長々と述べることにしました。

以上を、一つの図にまとめると下記のようになります。

電気回路は、この電気磁気学をベースにして、より工学的に使いやすい形に整理したものです。コンデンサの問題は静電界ですし、U字磁石の間に電気の流れた配線を通した時に配線にかかる力は、静磁界から動電界、動磁界までの間の成果で記述されます。電気回路の問題を解いていて、なんでこうするのか分からない!!??となったら、電気磁気学の教科書を紐解くとスッと分かることがあると思いますよ。

まとめ

・電気とは、電荷の動きによる現象の一つです。

・学問的には、電気磁気学で基本的な理論が語られます。

・電気磁気学から、電気回路理論、電子回路理論が発展していきます。

高校生の方は、下図の高校教科書に載っている公式を正しく暗記しましょう。そして、回路理論の学習をしてください。

大学生の方は、下図を心に描きながら電気磁気学を履修し、マクスウェル方程式に整理されるまでを理解して、電気回路や電子回路、電気電子材料などを学んでください。授業の際は、いつも心に下図を描き、迷子にならないようにしてください。途中、電位、ポテンシャル、電気数学、電束、磁束、磁気双極子etc といった用語が出てきますが、下図の何処なのか追記しながら学習すると迷子になりにくいです。