본문 바로가기 메뉴 바로가기

Doitman

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

Doitman

검색하기 폼
  • 분류 전체보기 (236)
    • StartUp (6)
      • 1달에 하나씩 서비스 런칭하기 (1)
      • 혼자 웹서비스 출시하기 (1)
    • 자기 개발 (71)
      • 영어 관련 (8)
      • Start-up 관련 (8)
      • 책 읽기 (42)
      • 교육 관련 (3)
      • 글쓰기 (5)
      • 건강 (3)
      • 3D 프린팅 (2)
    • IT (103)
      • IT 이것 저것 (34)
      • UNITY(C#) (22)
      • 알고리즘 문제 풀이 (37)
      • Machine learning (8)
    • 금융 (22)
      • 재무 (2)
      • 경영 (5)
      • 주식 (10)
      • 경제 일반 (5)
    • 프로젝트 (24)
      • WEPO (11)
      • Namugochi (2)
      • 빡쳐서 만드는 시리즈 (2)
      • 일기 (8)
    • 지나간 생각들 (2)
      • 간단한 생각들 (2)
      • 숙성된 생각들 (0)
      • 구체화된 생각들 (0)
  • 방명록

마르코프연쇄 (1)
[강화학습] 강화학습관련 수학이론_마르코프 결정 과정(MDP)

이 글은 그냥 개인적으로 공부한 내용을 정리할 목적으로 작성이 되었습니다 ㅎㅎ 마르코프 결정과정 (MDP) 관련 학습 내용 마르코프 연쇄 (Markov Chain) 마르코프 보상과정 (Markov Reward Process) 마르코프 결정과정 (Markov Decision Process) 마르코프의 특성 현재 상태에는 과거의 모든 정보가 포함되어 있다. 현재 상태를 알면 과거와 무관하게 미래상태를 예측할 수 있다. 마르코프 연쇄와 상태 변이 행렬(State Transition Matrix) 특정 상태에서 다른 상태로 변이될 확률을 표현한 행렬 집 학교 학원 PC방 치킨 분식 피자 운동 만화 잠 집 0.6 0.3 0.1 학교 0.3 0.4 0.3 학원 0.1 0.2 0.2 0.5 PC방 0.2 0.8 치킨..

IT/Machine learning 2022. 9. 30. 17:54
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • 랜덤맵
  • 주식투자
  • 일자별
  • 머신러닝
  • 크롤링
  • 경영학
  • 강화학습
  • ET5X
  • 주식
  • PYTHON
  • 시스템투자
  • IT기초
  • 스타트업
  • Anet
  • beautifulsoup
  • json
  • 심리학
  • 파이썬
  • Unity
  • requests
  • 비전공자
  • C#
  • 가격데이터
  • 터틀트레이딩
  • It
  • 알고리즘
  • 마케팅
  • 기초
  • 프로그래머스
  • 유니티
more
«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
글 보관함
250x250

Blog is powered by Tistory / Designed by Tistory

티스토리툴바