○ AWS의 DeepRacer는 장난감 경주 자동차에 자율주행 알고리즘을 학습시켜, 흥미롭고 재미있는 방식으로 머신러닝을 경험할 수 있는 프로그램
- DeepRacer는 강화학습 모델링을 통해 복잡한 트랙을 최적화된 주행 경로로 학습
- 인공지능의 큰 범주 안에 머신러닝이 포함되고, 머신러닝은 크게 지도학습(supervised learning), 비지도학습(unsupervised learning)², 강화학습(reinforcement learning)으로 나뉨
- 이들 중 강화학습은 무작위로 행동을 선택함에 따라 그에 따른 보상이나 벌점을 부여함으로써 최적화된(가장 높은 보상을 받는) 경로를 학습하는 방식. 예를 들면 바둑을 둘 때, A라는 위치에 두면 +5점, B라는 위치에 두면 +2점, C라는 위치에 두면 -10 등의 보상/벌점을 제공하여 알고리즘이 A를 선택하게 하는 것.
- DeepRacer 프로그램은 ①강화학습을 위한 각종 파라메터(핸들 조향각, 속도, 학습횟수 등) 설정 → ②할당된 시간만큼 반복 학습 → ③학습을 통해 생성된 모델을 평가 → ④가상(또는 실제) 레이스에 참가하는 순서