DeepLearning/BAIR 썸네일형 리스트형 The Unsupervised Reinforcement Learning Benchmark 지도 강화학습의 단점들 (The shortcomings of supervised RL) 강화 학습(Reinforcement Learning, RL)은 자율 차량 제어, 디지털 비서 (digital assistants), 리소스 할당과 같은 AI의 많은 문제를 해결하기 위한 알고리즘 외부 보상 기능 (extrinsic reward function)이 제공될 때, RL 에이전트가 바둑이나 스타크래프트 같은 매우 복잡한 작업을 수행가능 하지만, 이런 놀라운 결과에도 사용 범위가 매우 좁음. 오늘날 대부분의 RL 알고리즘은 훈련된 단일 작업만 해결할 수 있으며 크로스 작업 (cross-task) 또는 크로스 도메인 (cross-domain) 일반화 기능이 없음. (Even the best RL agents to.. 더보기 이전 1 다음