問題. せんべい
1 から までの番号が付けられた 枚のせんべいが一様ランダムに並べられている.このせんべいを先頭から順番に食べるかどうかを選び最大で 枚を食べる. 番目のせんべいを食べるかどうか決めるときに, 番目のせんべいの番号は分からないが, 番目のせんべいを含む今まで見てきたすべてのせんべいの番号の大小関係は分かる.番号が のせんべいを食べた確率が最大となる選び方をしたときの確率を答えよ.
制約:
解法.確率DP
解説 を参考にした.
戦略を考えるときに何が判断材料にできるのかを考えると,何番目のせんべいについて考えているのか,あと何枚食べれるのかという 2 つがある.また,今まで見てきたせんべいの大小関係は分かるが,見たせんべいの番号は分からない.しかし,すべてのせんべいを見たあとならば大小関係から番号 のせんべいを食べたかどうかは分かる.したがって,今までで見たせんべいで番号が最も大きいものを食べたかどうかという情報も戦略に必要かもしれないので,前に述べた 2 つの情報と合わせて 3 つの情報をもとに動的計画法を行う.
漸化式 dp[i][j][b]
を,残り 枚食べれて,1 から 番目の中での最大番号のせんべいを食べたかどうかをブール値 で表して, 番目のせんべいを見ているときに最適な戦略を行ったときの,番号 のせんべいを食べた最大確率とする.
番目のせんべいを見ているとき, 番目のせんべいが今まで見たせんべいの中で番号が最大かどうかは分かっており,これらの起こりうる事象は互いに排反である.最大のものを食べた確率は で,食べていない確率は余事象の確率で である.これらの排反事象それぞれの場合について 番目のせんべいを食べるかどうかの 2 通りの戦略を考えてその中で確率が最大となるものを選ぶことにする.
メモ化再帰で実装を行っている.実際の遷移はソースコードを参照. 番目のせんべいが最大番号でないときは食べる必要はないので省略することができる.
計算時間:
「任意の戦略の中で〜」系の問題で戦略を暗に仮定して失敗しているのは成長が見られないので反省.状態が十分かどうかの証明はどうするんだろう.ここらへんが曖昧すぎるので課題.