unhurried

コンピュータ関連ネタがほとんど、ときどき趣味も…

機械学習を理解するための数学のきほん

私が機械学習を始めるときに最初に読んだ本を簡単に紹介します。

概要

線形モデルを使った機械学習の数学的理論が、高校数学の知識で理解できるように解説されている。取り上げられている主な内容は以下の通り。

  • 回帰問題
    • 最小二乗法を使って、誤差関数を定義し、最急降下法でパラメータ更新式を求める手順
    • 多項式回帰、重回帰、確率的勾配法の適用方法
  • 分類問題
    • パーセプトロンを使って、座標的な意味からパラメータ更新式を求める手順
    • ロジスティック回帰の尤度関数を定義し、最急降下法でパラメータ更新式を求める手順
    • ロジスティック回帰への多項式特徴量の適用方法
  • モデルを評価するための交差検証
  • 線形モデルの過学習を防ぐための正則化(L1、L2)

また、これらの機械学習モデルをPythonでの実装方法(scikit-learnなどのライブラリを使わずに、NumPyを使って自分で実装する)も解説されている。

感想

機械学習を始めるに当たって、取っ付きやすい書籍を探して行きついたのが本書であった。グラフを使って数式の図形的な意味が解説されていて、巻末には数学を離れて久しい人が忘れていそうな基礎知識もまとめられているため、線形モデルの数学的理論の基礎を途中で詰まることなく理解することができた。

本書は機械学習で最近よく使われるアルゴリズムや、実践的なテクニックまでは触れていないが、数学を忘れかけている人が機械学習の基礎となる線形モデルの理論を理解するのにとても役に立つ本であると感じた。