본문 바로가기
#02.천재교육 빅데이터/+06.머신러닝 기초

[천재교육] 머신러닝 개념 및 기초

by 돌비오 2023. 3. 13.
728x90
머신러닝이란? (Machine Learning)

 

아서 사무엘(Arthur samuel) (1959)
컴퓨터 프로그램을 명시적으로 구현하는 대신 컴퓨터 스스로 학습하는 능력을 갖도록 하는 연구 분야


톰 미첼(Tom Mitchell) (1977)
과제 T에 대한 프로그램의 성능 P가 경험 E를 통해 향상되면 해당 “프로그램이 경험 E를 통해 학습한다” 라고 말한다.


위키 피디아
기계학습 또는 머신러닝은 경험을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구로, 컴퓨터가 학습할수 있도록 하는 알고리즘과 기술을 개발하는 분야.

 

 

 

예시)

X : 고객들의 개인정보 및 금융 관련 정보 → Y : 대출 연체 여부
X : 고객의 상품 구매 내역 → Y : 고객의 취향
X : 학생의 인강 수강기록, 연습문제 풀이이력 → Y : 중간고사 시험 점수

 

 

 

 

머신러닝의 종류

 

 

 

 

학습 데이터 vs 테스트 데이터

- 학습데이터: 모델을 만들기 위해 갈아넣는 학습용데이터. 보통 전체데이터의 80%

- 테스트데이터: 모델이 괜찮게 만들어졌는지 테스트하기 위해 따로 구별해놓은 데이터. 보통 전체데이터의 20%

 

 

 

 

지도 학습 vs 비지도 학습

 

 

- 지도학습: 데이터마다 레이블을 붙여서 지도 및 구별해놓음. 예를 들어 스팸메일 자동분류기.

- 비지도학습: 레이블이 없는 데이터를 이용. 패턴이나 상관관계를 분석한다.

 

 

 

 

머신러닝의 주요 도전과제

1. 과대적합 (Overfitting)

 

 

2. 과소적합(Underfitting)

 

3. 아웃라이어

 

 

 

 

머신러닝의 과정

728x90