What is Supervised Learning? (jp,ko)
一般的にMLの学習方法は大きく’教師あり学習(Supervised Learning)’と’教師なし学習(Unsupervised Learning)’分けられる。このポストでは’教師あり学習’についで説明する。
教師あり学習の定義
MLで サンプルに 対応する ターゲットの正答を提供する方式。
例えば、機械翻訳でサンプルは 一言語の文章で、ターゲットは翻訳しようとする言語の文章だ。
教師あり学習システムの主な要素は六つで、以下の通りある。
1.サンプル
- 予測に 使用されるアイテム、通常、数式で xと表記する。Input(入力)とも言う。
2.ターゲット
- サンプルに相応するレーベル(区分すべき複数のクラスのうちの一つ)、一般的に予測される対象を意味する。普通 yと表記する。Ground Truth(正答)とも言う。
3.モデル
- 数学式やサンプル(x)を受けてターゲットレーベル値を予測する関数だ。
4.パラメータ
- 荷重値(weight)とも呼ばれる。モデルを規定し、普通wと表記する。
5.予測
- モデルが 推測するターゲット値 推定とも呼ばれる. ‘ヘッ’ 表記を使って表す。 yの予測は \(\hat{y}\)ともひょうきする。
6.損失関数
- 訓練データに対する予測がターゲットとどれほど遠く離れているかを比較する関数、ターゲットと予測が算出されれば損失関数は損失(Loss)と呼ぶ実数を計算する。この値が低いモデルほど良い性能のモデルを意味する。通常Lと表記する。EX) \(L(y,\hat{y})\)
教師あり学習の種類
教師あり学習には二つの主な種類がある。
分類(Classification)
-
バイナリ分類 (Binary Classification)
- あるデータについて二つのうち一つに分類すること。
- 例、Q.このメールはスパムメールですか?
- A.はい or いいえ。
- あるデータについて二つのうち一つに分類すること。
-
多重分類 (Multi Classification)
- あるデータについて色々な種類のうち一つに分類すること。
- 例、Q.この動物は何ですか?
- A. 猫 or 犬。
回帰(Regression)