728x90
머신러닝이란? (Machine Learning)

아서 사무엘(Arthur samuel) (1959)
컴퓨터 프로그램을 명시적으로 구현하는 대신 컴퓨터 스스로 학습하는 능력을 갖도록 하는 연구 분야
톰 미첼(Tom Mitchell) (1977)
과제 T에 대한 프로그램의 성능 P가 경험 E를 통해 향상되면 해당 “프로그램이 경험 E를 통해 학습한다” 라고 말한다.
위키 피디아
기계학습 또는 머신러닝은 경험을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구로, 컴퓨터가 학습할수 있도록 하는 알고리즘과 기술을 개발하는 분야.


예시)
X : 고객들의 개인정보 및 금융 관련 정보 → Y : 대출 연체 여부
X : 고객의 상품 구매 내역 → Y : 고객의 취향
X : 학생의 인강 수강기록, 연습문제 풀이이력 → Y : 중간고사 시험 점수
머신러닝의 종류

학습 데이터 vs 테스트 데이터

- 학습데이터: 모델을 만들기 위해 갈아넣는 학습용데이터. 보통 전체데이터의 80%
- 테스트데이터: 모델이 괜찮게 만들어졌는지 테스트하기 위해 따로 구별해놓은 데이터. 보통 전체데이터의 20%
지도 학습 vs 비지도 학습


- 지도학습: 데이터마다 레이블을 붙여서 지도 및 구별해놓음. 예를 들어 스팸메일 자동분류기.
- 비지도학습: 레이블이 없는 데이터를 이용. 패턴이나 상관관계를 분석한다.
머신러닝의 주요 도전과제
1. 과대적합 (Overfitting)

2. 과소적합(Underfitting)

3. 아웃라이어

머신러닝의 과정

728x90
'#02.천재교육 빅데이터 > +06.머신러닝 기초' 카테고리의 다른 글
| [천재교육] 결정트리, KNN(K-Nearest Neighbor) 알고리즘 (0) | 2023.03.14 |
|---|---|
| [천재교육] 분류(Classification) (0) | 2023.03.14 |
| [천재교육] 판다스(pandas) (0) | 2023.03.14 |
| [천재교육] 넘파이(Numpy) - 인덱싱, 정렬, 선형대수 연산 (0) | 2023.03.13 |
| [천재교육] 전처리, 데이터 인코딩, 스케일링 (2) | 2023.03.13 |