読み進まない・・・。
「2.4.3 二値分類」と「2.4.4 多クラス分類」で足踏みしている。
数式を理解するというのは最初からあきらめているので、そこは問題ない(ないのか?)。
まずは、この数式はこういうことをしたい、とか、この数式によって得られるものはこれだ、とか、そういう意味の部分だけで読み進めようとしている。
「二値分類」は入力されたものをAかBかに分類する。
Aか、そうでなければBだ。
「多クラス分類」は入力されたものを複数のどれかに分類する。
「これが一番近いな」という確率が一番高いものに振り分ける。
そこら辺の感覚はなんとなくわかるのだが、用語が出てきて悩む。
本では、二値分類の説明で「この問題を定式化する方法はいくつかある」といい、例として「事後確率をモデル化する」ということになった。
まあ、例を何かあげないとわかりづらいだろうということで、そうされたのだろう。
この「事後」で、止まってしまった。
「事後」があるなら、「事前」もあるはず。
ネットで検索すると、あった。
いくつか読んで、私の解釈としては、
- 事前確率:今までの結果から、今度はこういう確率になるんじゃなかろうか、という確率。
- 事後確率:そして実際にやってみた結果から計算した確率。
なのだが、なんか釈然としない。
結局、事後確率は事前確率と同じじゃないかという気持ちだ。
次の事象が発生しなければ事後確率だけど、発生したらそれは事前確率になるんじゃないだろうか。
そんなことを考えると、私の解釈が間違っているような感触が強い。
うーむ。
でも、事前の確率がどうであれ、事後の確率(というか、結果)が正しくないと意味がない。
だから「事後確率」の話をしているのかもしれない。
なので、もしかすると「事後確率」というのは、単に結果のこと、しかも1回だけじゃなくて何度もやった結果、と考えてもよいのかも。
どうかな?
手元に残っていた、学生時代の確率の教科書を眺めている。
「事前」「事後」らへんの言葉で目次に出てくるのは、「事後密度」で、節としては「ベイズ推定量」、章でいえば「統計的決定問題」になっている。
教科書で例になっているのは、油田の掘削を続けるかどうかを決める課題だ。
掘削するための調査をするかどうか、というところでどうするか考えている段階だ。
調査するには、お金がかかる。
でも、調査しないとわからない。が、調査した結果が100%正しいとも言えない。
そして調査結果の確率もパターンがあり、結果は「油田がある」「油田がない」「どちらともいえない」なんだけど、実際に油田があったときの調査結果確率と、油田がなかったときの調査確率が別になっている。
それだけでなく、油田を売るかどうか、というのも考慮がいる。
売るとお金が入ってくるのだ。
だから、油田がなかった場合は、調査もせずに売るのが一番収入が大きい。
逆も然りで、油田がある場合は、調査もせずに掘削するのが一番収入が大きい。
うーん、うーん・・・
統計数学 - 近代科学社
これが教科書だったのだ(私は九州大学関係ではないけど)。
「ベイズ」で見てみると、上の問題については「ベイズ決定法」が出てきた。
「経営陣の経験と勘で重みを与える」って・・・。
その「経験と勘」が、大量な学習データということになるのかな?
まだ「深層学習」を読んでいるところでは、そういう話は出てきてない。
とりあえず、2値にしろ多クラスにせよ、「事後確率の尤度を最大にする」のが目標。
数学用語?だと難しいが、ともかく「一番それっぽい値になるようにがんばる」ということだろう。
よく考えると、これは見積の「KKD(経験・勘・度胸)」と似てるよなあ(通称:えいやっ)。
「深層学習を応用することで見積ができる!」みたいなのは、面白そうだ(パラメータが難しそうだが)。
でも、学習できるほどの情報が集まらないか。
けれども、見積が人工知能でできるっていうのは、プロジェクト管理者としてはありがたいよな。
あるいは「このお客さんはどのくらいの仕様変更を出してきそうか」みたいなののほうが面白いか。
きっと、そのお客さんには見せられないようなパラメータがたくさんあるんだろうな。
お客さんの会社だけじゃなくて、その担当者自身の情報もパラメータにしないといかんだろうし。
こういう「自分ではどうしようもないし、自分の責任になってしまう」ようなものは、理論で解決することはできなさそうだけど、人工知能みたいなもので第3者的な意見を出せるようになると、その人の精神的負担は減るだろうな。
まあ、そうなったらそうなったで、「なんでコンピュータが出せたような結果がお前は出せないんだ!」とかなりそうだけど。
0 件のコメント:
コメントを投稿
コメントありがとうございます。
スパムかもしれない、と私が思ったら、
申し訳ないですが勝手に削除することもあります。
注: コメントを投稿できるのは、このブログのメンバーだけです。