tsujimotterのノートブック

日曜数学者 tsujimotter の「趣味で数学」実践ノート

「PRML勉強会#4@筑波大学」で発表してきました #PRML学ぼう

PRML と呼ばれる本をご存知でしょうか。

正確な名前は「パターン認識と機会学習」といって、この分野を勉強するにあたっては避けて通れない由緒正しい教科書です。

その分厚さと威圧感、そしてひと際目立つその色の特徴から通称「黄色い本」と呼ばれて恐れられています。日本語版は、以下の上下巻構成となっています。

パターン認識と機械学習 上

パターン認識と機械学習 上

  • 作者: C.M.ビショップ,元田浩,栗田多喜夫,樋口知之,松本裕治,村田昇
  • 出版社/メーカー: 丸善出版
  • 発売日: 2012/04/05
  • メディア: 単行本(ソフトカバー)
  • 購入: 6人 クリック: 33回
  • この商品を含むブログ (17件) を見る

パターン認識と機械学習 下 (ベイズ理論による統計的予測)

パターン認識と機械学習 下 (ベイズ理論による統計的予測)

  • 作者: C.M.ビショップ,元田浩,栗田多喜夫,樋口知之,松本裕治,村田昇
  • 出版社/メーカー: 丸善出版
  • 発売日: 2012/02/29
  • メディア: 単行本
  • 購入: 6人 クリック: 14回
  • この商品を含むブログを見る


この本は、数式が非常に多く、線形代数やベクトル解析、確率統計の基礎知識を前提としていて、初心者には敷居が高いことで知られています。

そのため、各所でこの本を読むための勉強会や輪講が開かれています。今回は、筑波大学で開催された勉強会についてのレポートです。


ちなみに "PRML" というのは、この本の英語タイトル "Pattern Recognition and Machine Learning" の頭文字をとっています。


私は元々「ぴーあーるえむえる」と呼んでいましたが、「プルムル」と呼ばれたり「プレモル」と読んだりするそうです。ちなみに、つくばの勉強会では「プレモル」推奨とのこと。笑

辻が参加したきっかけ

この勉強会に参加したきっかけについて少々。もともと主催者の上田君とは「情報科学若手の会」というイベントがきっかけで知り合ったのでした。そのときは、彼がつくばで私が札幌にいたので、それ以降連絡をとるきっかけは無かったのです。その二年後にたまたま辻がつくばに勤務することになりましたので、意を決して声をかけてみようと思った矢先、こんな素敵な会が開かれていた、というわけです。

以降、私がつくばに来て間もないということもあって、「先輩」の上田君にいろいろ美味しいご飯のお店を教えてもらっています。笑

勉強会のようす

f:id:tsujimotter:20150601220756j:plain:w240

第四回のイベント情報はこちらです。cs-cafe.connpass.com

主催者の上田君のブログはこちら。

PRML勉強会#4 @筑波大学 を開催した #PRML学ぼう - Laplace's Demon


参加者の枠は発表者含めて7人。少人数で「顔が見える会」となっています。なので、分からないことに出くわしてもきっちり理解して帰ることが出来ます。特に PRML に関しては、すぐに飲み込むことは難しいので、分からないところは食い下がっていかないと後悔します。その意味では、これぐらいの人数がちょうど良いのではないかなと私も思います。


もう1つの特徴は「全員がPRML持参」ということでしょうか。予めある程度の予習をしてきた方が良さそうです。

上田君のブログにも書いてありましたが、次回は全員簡単な LT (ライトニングトーク:3分程度の簡単な発表) するようになるかもしれません。自分から話した方が、会に溶け込みやすいので、私もおすすめです。

辻の発表

私は第3回と第4回に参加して、第4回では発表もしてきました。


第3.1.2章に書いてある「最小二乗法の幾何学」について、内容を詳しく解説しました。この辺の内容は「(何かと話題の)情報幾何」のイントロダクションで出てきたり、割と重要な概念だと思うのですが、PRML にはさらっと書いてあるだけなんですよね。

「最小二乗法は、幾何的に捉えると、M次元超平面に対する正射影を求める手法である」というのが伝えたいメッセージです。補足もなかなか充実していて、二次形式の平方完成に触れています。興味ある方はそちらもどうぞ。

スライドを観ていただけると分かるのですが、行列の計算における「行と列の数」の図示にこだわっています。PRML の本を読解する際は、ナゾの行列がたくさん出てきますので、このように書いて確認しながら進めるのがおすすめです。


ほかの方の発表もなかなか興味深かったのですが、特に RANSAC という手法の発表が面白かったです。最小二乗法を解くために、すべてのデータで直線を引くのではなく「3つだけで直線を引くセット」を大量に実行して、一番誤差がなくなるものを選ぶという、とてつもなくシンプルで強引な手法です。これがどうやら精度もロバスト性も良いのだそうで。簡単に実装できそうなので、今度作ってみようかな。

おわりに

とても楽しい会なので、宣伝したい気持ちはあるのですが、あまり人気になって、参加者枠がすぐに埋まってしまうと私も困るのです。笑

が、おすすめしたい会なことは変わりませんので、近隣で興味がある方はぜひ参加にチャレンジしてみてください。

私は次回は予定があって参加できません。。。
(なので、次回は一枠空くよw)


次回の参加募集はこちら:
cs-cafe.connpass.com

参考

直接関係ないですが良い記事だと思ったので紹介します。yumulog.hatenablog.com