抄録
Offer Organization: -, System Name: -, Category: -, Fund Type: competitive_research_funding, Overall Grant Amount: - (direct: 5000000, indirect: 1500000)
本研究では,情報系諸分野の理論を探索して,不完全情報下における逐次的意思決定の分析手法を開拓することを目的とする.具体的には,私的観測というお互いの行動を正確に観測できない不完全観測下で繰り返し行われる意思決定をゲーム理論の枠組みで考え,そのゲームの帰結 (均衡) を求める.これは部分観測可能マルコフ決定過程に帰着できることが知られているが,解析可能な定式化や解法は未だ見つかっていない.そこで,近年発展が著しい機械学習理論/制御理論/情報理論といった諸分野の理論から,大規模な問題に適用可能な,精度保証つきの近似解法を構築する.