2017-08-19から1日間の記事一覧

2017-08-19

Multi-armed bandit 問題で理解する強化学習の概念

強化学習 Q関数

Multi-armed bandit 問題はSutton先生の "Reinforcement learning An introduction"で紹介される最初の問題である。強化学習がどのような問題で有効的なのかを理解するのに適している。問題の説明 Multi-armed bandit ( N-armed bandit ) では以下のシナリ…