What is Supervised Learning? (jp,ko)

一般的にMLの学習方法は大きく’教師あり学習(Supervised Learning)’と’教師なし学習(Unsupervised Learning)’分けられる。このポストでは’教師あり学習’についで説明する。

教師あり学習の定義

MLで サンプルに 対応する ターゲットの正答を提供する方式。

例えば、機械翻訳でサンプルは 一言語の文章で、ターゲットは翻訳しようとする言語の文章だ。

教師あり学習システムの主な要素は六つで、以下の通りある。



1.サンプル

  • 予測に 使用されるアイテム、通常、数式で xと表記する。Input(入力)とも言う。

2.ターゲット

  • サンプルに相応するレーベル(区分すべき複数のクラスのうちの一つ)、一般的に予測される対象を意味する。普通 yと表記する。Ground Truth(正答)とも言う。

3.モデル

  • 数学式やサンプル(x)を受けてターゲットレーベル値を予測する関数だ。

4.パラメータ

  • 荷重値(weight)とも呼ばれる。モデルを規定し、普通wと表記する。  

5.予測

  • モデルが 推測するターゲット値 推定とも呼ばれる. ‘ヘッ’ 表記を使って表す。 yの予測は \(\hat{y}\)ともひょうきする。

6.損失関数

  • 訓練データに対する予測がターゲットとどれほど遠く離れているかを比較する関数、ターゲットと予測が算出されれば損失関数は損失(Loss)と呼ぶ実数を計算する。この値が低いモデルほど良い性能のモデルを意味する。通常Lと表記する。EX) \(L(y,\hat{y})\)   

教師あり学習の種類

教師あり学習には二つの主な種類がある。

分類(Classification)

  1. バイナリ分類 (Binary Classification)

    • あるデータについて二つのうち一つに分類すること。
    • 例、Q.このメールはスパムメールですか?
    • A.はい or いいえ。
  2. 多重分類 (Multi Classification)

    • あるデータについて色々な種類のうち一つに分類すること。
    • 例、Q.この動物は何ですか?
    • A. 猫 or 犬。

回帰(Regression)