気になったので、ロジスティック回帰について書いてある本を買ってきた。
O'Reilly Japan - 統計クイックリファレンス 第2版
統計学の本って、いろいろあるのね。。。
本屋でかなり悩んだ。
私は博多駅横にある交通センター6階にある紀伊國屋でだいたい買うのだが、その本棚の2列分が統計学だった。
その1列は、SPSSとかRとかSASとか、何かそういう言語かツールを使って実現するための本っぽかった。
この本は、分厚い。
CR2032の大きさと比較してみると、このくらいだ(関係ないけど、2032とか2016の後ろの2桁は厚みなのね)。
最初から読まなくていい、と書いてあるが、読んでいってもなかなか面白い。
以前悩んでいた、条件付き確率のことなども書いてある。
あまり重苦しい文体ではなく、文章を読んでいても面白い。
ロジスティック回帰のところまではまだ読み進んでないが、線形回帰のところを読んでいる。
例では、身長と体重の関係が題材になっている。
身長が高い人は、だいたい体重も重たくなるよね、という仮定を元に、その傾向を1次式で表す。
体重=身長×係数+定数
もちろん、これが必ずしもそうはならないのはわかるけど、まあ、だいたい、そうじゃないの?くらいで進めるようだ。
で、この推測に基づいていくつかのデータを取って、データを満たしそうな式を作る。
最小二乗法とかそういうやつですな。
この式を「回帰方程式」と呼ぶ。
じゃあ「回帰」はなにかというと、たぶんだが、こういうやり方自体を指している。
これは線形式に当てはめるので「線形回帰」とか「単純回帰」とか呼ぶようだ。
入力の変数が2つ以上だと「多重線形回帰」などになるらしい。
変数が1つじゃなかったら線形にならないんじゃないの?という気もするのだが、よく読めばわかるのかもしれない。
そして、出力結果(従属変数などと呼ぶ)が2値の場合の多重線形回帰を効果的に扱う回帰技法が「ロジスティック回帰」のようだ。
CNTKのチュートリアルやSimple2dも、ラベルは0か1の2値だ。
そこがわかれば、ひとまずはよいかな。
統計のことは勉強しても面白そうなので、もうちょっと読んでいこう。
0 件のコメント:
コメントを投稿
コメントありがとうございます。
スパムかもしれない、と私が思ったら、
申し訳ないですが勝手に削除することもあります。
注: コメントを投稿できるのは、このブログのメンバーだけです。