What is Supervised Learning?

일반적으로 머신러닝의 학습 방법은 크게 “지도 학습”과 “비지도 학습”으로 나뉜다. 이번 포스트는 “지도 학습”에 대해 설명할 것이다.

지도 학습

머신러닝에서 샘플에 대응하는 타겟의 정답을 제공하는 방식. 기계 번역 Task 기준으로 샘플은 한 언어의 문장이고, 타겟은 번역하고자 하는 언어의 문장이다.

지도 학습 시스템의 주요 개념은 총 6가지로 다음과 같다.

1.샘플
예측에 사용되는 아이템, 보통 수식에서 x로 표기한다. Input(입력)이라고도 한다.

2.타겟
샘플에 상응하는 레이블(구분해야할 여러 클래스 중 하나), 일반적으로 예측되는 대상을 뜻한다. 보통 y로 표기한다. Ground Truth(정답)이라고도 한다.

3.모델
수학식이나 샘플(x)를 받아 타겟 레이블값을 예측하는 함수이다.

4.파라미터
가중치(weight)라고도 불린다. 모델을 규정하며 보통 w로 표기한다.

5.예측
모델이 추축하는 타겟값, 추정이라고도 불린다. ‘햇’ 표기를 사용해 나타낸다. y의 예측은 \(\hat{y}\)으로 표기한다.

6.손실 함수
훈련 데이터에 대한 예측이 타겟과 얼마나 멀리 떨어져 있는지 비교하는 함수, 타겟과 예측이 산출되면 손실 함수는 손실(Loss)라 부르는 실수 스칼라값을 계산한다. 이 값이 낮은 모델일수록 좋은 성능의 모델을 의미한다. 보통 L로 표기한다. EX) \(L(y,\hat{y})\)

지도학습의 종류

지도 학습에는 두가지 Task가 존재한다.

분류(Classification)

  1. 이진 분류 (Binary Classification)

    • 한 데이터에 데해 둘 중 하나로 분류하는 Task.
    • 예시, Q.메일 X는 스팸입니까?
    • A.예(1) or 아니오(0)
  2. 다중 분류 (Multi Classification)

    • 한 데이터에 대해 여러 종류 중 하나로 분류하는 Task.
    • 예시, 이 동물은 무엇입니까?
    • A. 고양이 or 개.

회귀(Regression)

  • 데이터들의 Feature를 기준으로, 연속된 값(그래프)를 예측하는 문제. 어떤 패턴이나 트렌드, 경향 등을 예측할 때 사용된다.
  • 답이 분류처럼 1, 0 등으로 딱 떨어지는 것이 아닌 어떤 실수나 수로 예측된다.
  • 예시, 서울의 20평대 아파트 집값 예측 가격 등



+)Feature

데이터의 값을 잘 예측하기 위한 데이터의 특징