強化学習アルゴリズム入門「平均」からはじめる基礎と応用

Sogabe TOHMA

戻る

図書

強化学習アルゴリズム入門「平均」からはじめる基礎と応用

Sogabe TOHMA

オーム社

24/05/2019

抄録

AlphaGoがプロ棋士を破った2016年以降、強化学習や深層強化学習はさまざまな分野から注目を集めています。しかし、専門書では難解な専門用語や数式が多用されるため、初学者にとってはハードルが高い状態が続いていました。本書は、そのハードルの高さを解消することを目的に制作されました。平均という初歩的な数学を使うことで、「価値」「探索」「マルコフ性」といった強化学習の基本をわかりやすく解説します。また、各アルゴリズムについては、「多腕バンディット問題」および「グリッドワールド問題」のいずれかを用いて、比較しやすい状態で解説します。そのため、各アルゴリズムの特徴や差異がわかりやすくなっています。さらに、中核的なアルゴリズムについては、PythonとMATLABの2種類のコードを、オーム社のWebサイトおよびGithubで配布します。配布コードを実行することで、「原理→数式→プログラム」という一連の流れを直感的に把握できます。

ファイルとリンク (1)

url

https://www.ohmsha.co.jp/book/9784274223716/表示

is_downloadable: False

メトリック

4 レコードビュー

詳細

タイトル: 強化学習アルゴリズム入門「平均」からはじめる基礎と応用
作成者 – 役職なし: Sogabe TOHMA
出版者: オーム社
ID: 991002576704107421
組織: The University of Electro-Communications
言語: 日本語
資料タイプ: 図書
リソースのサブタイプ: rm_books_etc: Scholarly Book