지도, 비지도, 강화 학습의 특징
지도 학습
- 레이블된 데이터
- 직접 피드백
- 출력 및 미래 예측
비지도 학습
- 레이블 및 타깃 없음
- 피드백 없음
- 데이터에서 숨겨진 구조 찾기
강화 학습
- 결정 과정
- 보상 시스템
- 연속된 행동에서 학습
지도학습으로 미래 예측
분류: 클래스 레이블 예측
과거의 관측을 기반으로 새로운 샘플의 범주형 클래스 레이블을 예측하는 것이 목적
클래스 레이블은 이산적이고 순서가 없어 샘플이 속한 그룹으로 이해할 수 있음
회귀: 연속적인 출력 값 예측
예측 변수(또는 설명 변수, 입력)와 연속적인 반응 변수(또는 출력, 타깃)가 주어졌을 때 출력 값을 예측하는 두 변수 사이의 관계를 찾음
번호 | 알고리즘 이름 | 분류 문제 | 회귀 문제 |
1 | 선형회귀(linear regression) | X | O |
2 | 정규화(regularization) | X | O |
3 | 로지스틱 회귀(logistic regression) | O | X |
4 | 서포트 벡터 머신(support vector machine) | O | O |
5 | 커널(kernel) 기법을 적용한 서포트 벡터 머신 | O | O |
6 | 나이브 베이즈 분류(Naive Bayes classification | O | X |
7 | 랜덤 포레스트(random forest) | O | O |
8 | 신경망(neural network) | O | O |
9 | k-최근접 이웃 알고리즘(k-nearest neighbors algorithm, kNN) | O | O |
표1. 지도 학습 알고리즘과 분류 및 회귀 문제 여부
강화 학습으로 반응형 문제 해결
강화 학습은 환경과 상호 작용하여 시스템(에이전트, agent) 성능을 향상하는 것이 목적
강화 학습의 피드백은 보상 함수로 얼마나 행동이 좋은지를 측정한 값.
에이전트는 환경과 상호 작용하여 보상이 최대화되는 일련의 행동을 강화 학습으로 학습함.
강화 학습의 대표적인 예는 체스 게임으로 에이전트는 체스판의 상태에 따라 기물의 이동을 결정함.
보상은 게임을 종료했을 때 승리하거나 패배하는 것으로 정의
강화 학습에는 여러 하위 분류가 있음. 일반적인 구조는 강화 학습 세이전트가 환경과 상호작용하여 보상을 최대화하는 것. 각 상태는 양의 보상이나 음의 보상과 연관됨
비지도 학습으로 숨겨진 구조 발견
군집: 서브그룹 찾기
군집clustering은 사전 정보 없이 쌓여 있는 그룹 정보를 의미 있는 서브그룹(subgroup) 또는 클러스터(cluster)로 조직하는 탐색적 데이터 분석 기법.
차원 축소: 데이터 압축
고차원의 데이터를 다룰 때 잡음 데이터를 제거하기 위해 특성 전처리 단계에서 종종 적용.
관련 있는 정보를 대부분 유지하면서 더 작은 차원의 부분 공간으로 데이터를 압축.
번호 | 알고리즘 이름 | 차원 축소 | 클러스터링 |
10 | 주성분 분석(principal component analysis, PCA) | O | X |
11 | 잠재 의미 분석(latent semantic analysis, LSA) | O | X |
12 | 음수 미포함 행렬 분해(non-negative matrix factorization, NMF) | O | X |
13 | 잠재 디리클레 할당(latent Dirichlet allocation, LDA) | O | X |
14 | k-평균 알고리즘(k-means algorithm) | X | O |
15 | 가우시안 혼합 모델(Gaussian mixture model, GMM) | X | O |
16 | 국소 선형 임베딩(local linear embedding, LLE) | O | X |
17 | t-분포 확률적 임베딩(t-distributed stochastic neighbor embedding, t-SNE) | O | X |
표2. 비지도 학습 알고리즘과 차원 축소 및 클러스터링 여부
'Study > 머신러닝/딥러닝' 카테고리의 다른 글
Window 10에 우분투 멀티부팅 설치 (0) | 2018.04.06 |
---|---|
우분투에 아나콘다 설치하기 (0) | 2018.04.06 |
EM Algorithm과 k-means Clustering (0) | 2018.04.03 |