본문 바로가기

머신러닝

(2)
[강화학습 LR] 1. Cartpole 예제 돌려보기 안녕하세요 강화학습으로 다시 돌아왔습니다. 오늘은 가장 기본 예제인 Cartpole 예제를 작동시켜볼겁니다. Cartpole 이 뭐냐면 바로이겁니다. https://gymnasium.farama.org/environments/classic_control/cart_pole/ Gymnasium Documentation A standard API for reinforcement learning and a diverse set of reference environments (formerly Gym) gymnasium.farama.org 카트 위에 막대를 쓰러뜨리지 않게 하는 게임입니다. 우선 이 게임을 하기 전에 지난 시간에 올린 강화학습의 요소를 잠깐만 보고 가자면 1. 환경 2. 행동(액션) 3. 점수 가 ..
[강화학습 LR] 0. python 가상환경 구성하기 안녕하세요 여러분 오랜만에 포스팅입니다. 허허 의도하진 않았지만 어쩌다보니 머신러닝을 하게 되었습니다. 아예 배경지식이 없어서 공부를 먼저하는게 맞지만 저도 필요에 의해서 진행하는거다보니 예제부터 먼저 해보게되었습니다. 이론적인 공부는 나중에 천천히 같이 해봅시다. 우선 머신러닝 중에서도 강화학습 파트를 하게되었는데 조금 찾아보니 강화학습 = 알파고 라고 생각하는 편이 편했습니다. 간단하게 특정 '환경'에서 특정 '행동'을 취했을 때 얻게되는 '점수'를 기준으로 닥터스트레인지 마냥 무수히 많은 경우를 찾아내서 가장 점수가 높도록 행동하는게 강화학습의 기본 원리라고 이해했습니다. 우선 가장 기본이 되는 python 가상환경부터 구성해봅시다. 저는 다른 코딩을 할 때 웬만하면 가상환경을 구성해서 쓰지 않았는..