World Modelsは2018年に発表された生成モデルで、強化学習の環境を生成する。
論文:https://arxiv.org/abs/1803.10122

論文ではVAEによって画像を潜在変数に圧縮し、行動と合わせてLSTMに入力することで未来予測を行う。
これによって環境を生成する内部モデルであるWorld Modelsが構成される。
エージェントはWorld Modelsで作った仮想環境のみから強化学習を行って(夢の中での訓練)、
実際の環境でも上手く機能する行動を獲得することが出来たらしい。
参考:https://note.com/npaka/n/n01d81f1e34b1

脳内の予測モデルを作成するという点で、動画の未来予測を行うPredNetと似たところがあると感じた。