티스토리 뷰

머신러닝이란,

컴퓨터가 '의사결정'을 할 수 있도록 '교육' 하는 것이다

.

사람이 하는 의사결정에는 크게 2가지가 있다.

  • 분류 : 어떤 사진속 동물을 보고 "개"인지 "고양이"인지 판단하는 것
  • 예측 : 내가산 주식 가격이 오를지 내려갈지 판단하는 것

오늘 배울 내용은, 컴퓨터가 의사결정을 할 수 있도록 하기 위해

어떻게 컴퓨터를 교육하는지에 대한 부분이다.

 

컴퓨터를 교육하는 방식에는 크게 두가지 방법이 있다

  • 지도학습
  • 비지도학습

지도학습

 

지도학습이란, "결과"를 알고 있을때 사용하는 학습 방법이다.

 

지도학습은 이미 인간이 알고있는 규칙성을 컴퓨터에게 학습시켜,

반복적인 의사결정을 컴퓨터가 할 수 있도록 한다. 

 

지도학습의 방법에는 두가지가 있다

  • 분류(classification) = 고양이 사진을 통해 고양이의 특징을 학습 => 어떤 사진이 고양이인지 판단
  • 회귀(regression) = 습도에 따라 강우량이 어떻게 변하는지 학습 => 현재 습도로 강우량 예측

 

컴퓨터에게 "고양이는 이렇게 생겼어" 라고 알려준다.

여기서

고양이 "사진"입력 변수 (input variable) 이라고 한다.

 

사진을 보고 "고양이"라는 단어를 이야기하는 것을 출력이라고 하고

"고양이"출력 변수이다.

 

여러 고양이 사진을 통해 "고양이"가 무엇인지 학습한 컴퓨터에게

새로운 고양이 사진을 보여주었을때,

 

그것이 고양이인지 아닌지 '분류'할 수 있게 된다.

 

지도학습을 통해 고양이를 분류하게 된 컴퓨터

 


비지도 학습

 

비지도 학습은 "결과"를 모를 때 사용하는 학습방법이다.

즉, 아직 인간이 발견하지 못한 규칙성을 찾아내고자 할 때 비지도 학습을 사용한다.

 

비지도 학습의 예시는

  • 군집화 (clustering) : 상품 구매자의 패턴 분석 => 단골 손님이 될 수 있는 사람 찾기
  • 관계분석 (network) : 사람들의 연관 관계어 분석 => 어떤 상품을 검색한 사람이 관심있는 분야 발견

어떤 대상(data)들의 특징을 알고 싶을때.

 

어떤 대상(data)들의 관계를 알고 싶을 때


강화 학습

보상과 처벌을 이용한 학습

가장 보상이 높고, 처벌이 낮은 방법을 스스로 찾아가도록 하는 방법

 

강화 학습에 나오는 개념

  • agent = 행동의 주체
  • environment = 규칙
  • state = 현재 상태
  • action = 취할 수 있는 행동
  • reward = 보상

가장 보상이 많이 받을 수 있는 방법을 스스로 찾아가게 된다.

끝.

728x90
250x250
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함