ubnt-intrepid's blog

書いてあることがブログの内容です

深層カルマンフィルタ (1)

文献: [1511.05121] Deep Kalman Filters の感想 + 学習メモ。 流し読みしてみた感じそこまで難しいことはしてなさそうだったので、RNN の勉強がてら読んでみてる。

参考文献

深層カルマンフィルタ関連

その他参考にしたもの

関連ありそうで面白そうなもの(適当に選出)

概要

時系列データのモデリング機械学習(およびシステム同定など多くの分野)において重要な課題であり、多くのモデルが提案されている。それ自体膨大でありここですべてを網羅するのは困難であるため、ここでは文献中で取り上げられているものについて軽くまとめてみた。

  • 隠れマルコフモデル (hidden Markov model; HMM)
    観測系列の背後に離散的な値を取る潜在変数を仮定したモデル。 潜在変数の系列はマルコフ連鎖から生成される。

  • カルマンフィルター (Kalman filter; KF)
    線形システムにおいて、ノイズを伴う雑音から状態を推定するための無限インパルス応答フィルターのひとつ。 正確には、 KF という用語が指しているのはモデルではない(KF で用いられる対象の動的システムがモデル)。 古くから用いられてきたモデルであるが、線形性および雑音の正規性など前提条件が多いことが問題になる。 非線形システムへの適用を考慮し幾つかのバリエーションが存在する (EKF, UKF)。

  • 動的ベイジアンネットワーク (dymamic bayesian network; DBN) (訳はこれでいいのか不明)
    HMM, KF などを一般化したグラフィカルモデル。HMM や KF は DBN の特殊な場合として導出することが可能。 一般に複雑な状態遷移確率を設定した場合の学習則における各種値を解析的に求めるのは難しく、 モンテカルロ法や変分近似などを用いた近似計算が併用される。パーティクルフィルタやその他諸々を参照されたい。

  • 再帰ニューラルネットワーク (recurrent neural network; RNN)
    再帰的な構造を持つニューラルネットワーク(適当)。 NN の出力を確率とみなせば確率分布の近似にも用いることができる([1411.7610] Learning Stochastic Recurrent Networks など) 本文献では学習時において(変分)事後分布  q_{\phi} を近似するのに用いている

本論文は、上のモデルのうち非線形システムの同定を、カルマンフィルタで用いられている正規性の仮定などをうまく使って頑張る話。 観測と入力との間に複雑な非線形を持つような時系列データに対する生成モデルの学習における(深層学習を用いた)統一的な枠組みを与えている感じ。 結果が非線形システムとして与えられる点も制御・強化学習との組み合わせがきれいに出来そうで好印象。

...疲れたのでまずはここまで


(追記: 2016-10-15 03:04) 内容の重複するしている箇所を削除