強化学習とは、AI(人工知能)が機械学習するアルゴリズムの一種で、試行錯誤をしながら価値を最大化するような選択を学習する技術です。機械学習とはコンピューターが大量のデータをもとに自動的に反復学習する行為を指しますが、その種類は、手本が用意されている教師あり学習、自力でパターンを発見する教師なし学習、そして強化学習に分けられます。
強化学習の最大の特徴は、長期的な視点に立ちながら価値を最大化する行動を学習していくことです。例えば、先物取引で教師あり学習をする場合は「含み益が出れば即売却する」といった明確な指示を与えます。一方、教師なし学習は正解が与えられません。さらに、強化学習は指示がなくても利益を最大化するよう試行錯誤をし、将来の値上がりを予測して当分ホールドするといった選択を行います。
強化学習はAI研究の高まりで囲碁ソフトや自動運転といった形で実用化されつつあり、今後のAI活用では欠かせない役割の1つです。