티스토리 뷰
머신러닝이란,
컴퓨터가 '의사결정'을 할 수 있도록 '교육' 하는 것이다
.
사람이 하는 의사결정에는 크게 2가지가 있다.
- 분류 : 어떤 사진속 동물을 보고 "개"인지 "고양이"인지 판단하는 것
- 예측 : 내가산 주식 가격이 오를지 내려갈지 판단하는 것
오늘 배울 내용은, 컴퓨터가 의사결정을 할 수 있도록 하기 위해
어떻게 컴퓨터를 교육하는지에 대한 부분이다.
컴퓨터를 교육하는 방식에는 크게 두가지 방법이 있다
- 지도학습
- 비지도학습
지도학습
지도학습이란, "결과"를 알고 있을때 사용하는 학습 방법이다.
지도학습은 이미 인간이 알고있는 규칙성을 컴퓨터에게 학습시켜,
반복적인 의사결정을 컴퓨터가 할 수 있도록 한다.
지도학습의 방법에는 두가지가 있다
- 분류(classification) = 고양이 사진을 통해 고양이의 특징을 학습 => 어떤 사진이 고양이인지 판단
- 회귀(regression) = 습도에 따라 강우량이 어떻게 변하는지 학습 => 현재 습도로 강우량 예측
여기서
고양이 "사진"은 입력 변수 (input variable) 이라고 한다.
사진을 보고 "고양이"라는 단어를 이야기하는 것을 출력이라고 하고
"고양이"는 출력 변수이다.
여러 고양이 사진을 통해 "고양이"가 무엇인지 학습한 컴퓨터에게
새로운 고양이 사진을 보여주었을때,
그것이 고양이인지 아닌지 '분류'할 수 있게 된다.
비지도 학습
비지도 학습은 "결과"를 모를 때 사용하는 학습방법이다.
즉, 아직 인간이 발견하지 못한 규칙성을 찾아내고자 할 때 비지도 학습을 사용한다.
비지도 학습의 예시는
- 군집화 (clustering) : 상품 구매자의 패턴 분석 => 단골 손님이 될 수 있는 사람 찾기
- 관계분석 (network) : 사람들의 연관 관계어 분석 => 어떤 상품을 검색한 사람이 관심있는 분야 발견
강화 학습
보상과 처벌을 이용한 학습
가장 보상이 높고, 처벌이 낮은 방법을 스스로 찾아가도록 하는 방법
강화 학습에 나오는 개념
- agent = 행동의 주체
- environment = 규칙
- state = 현재 상태
- action = 취할 수 있는 행동
- reward = 보상
끝.
728x90
'IT > Machine learning' 카테고리의 다른 글
[ML/강화학습] 강화학습의 기본 이론_ 몬테카를로를 활용한 정책반복 (0) | 2022.10.03 |
---|---|
[강화학습] 강화학습 이론_비동기적 동적계획법 (0) | 2022.10.03 |
[강화학습] 최적의 행동은 어떻게 찾을까? _ 동적계획법 (feat 정책반복) (0) | 2022.10.03 |
[강화학습] 강화학습관련 수학이론_마르코프 결정 과정(MDP) (0) | 2022.09.30 |
머신러닝 vs 딥러닝 (0) | 2020.05.18 |
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 머신러닝
- 프로그래머스
- 사진크롤링
- 알고리즘
- requests
- Unity
- 터틀트레이딩
- ET5X
- 가격데이터
- 심리학
- 시스템투자
- 랜덤맵
- PYTHON
- 경영학
- C#
- 주식
- json
- Anet
- 일자별
- 마케팅
- 파이썬
- 크롤링
- 비전공자
- It
- 주식투자
- IT기초
- beautifulsoup
- 강화학습
- 유니티
- 스타트업
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함
250x250