切换到宽版

快捷通道

热搜： NOIP Pascal 教程

9595阅读
8回复

动态规划——动态规划的基本定理和基本方程 [复制链接]

上一主题下一主题查看指定楼层

查看指定楼层

离线arronking

OIFans复赛选手

只看楼主倒序阅读 0 发表于: 2005-10-30

— 本帖被 stevenjl 从资料教程移动到本区(2007-08-12) —

动态规划发展的早期阶段，从简单逻辑出发给出了所谓最优性原理，然后在最优策略存在的前提下导出基本方程，再由这个方程求解最优策略。后来在动态规划的应用过程中发现，最优性原理不是对任何决策过程普遍成立，它与基本方程不是无条件等价，二者之间也不存在任何确定的蕴含关系。基本方程在动态规划中起着更为本质的作用。

[基本定理]

对于初始状态x1∈X1，策略p1n*={u1*,..un*}是最优策略的充要条件是对于任意的k,1<k<=n,有

[推论]

若p1n*∈P1n(x1)是最优策略，则对于任意的k,1<k<n，它的子策略pkn*对于由x1和p1,k-1*确定的以xk*为起点的第k到n后部子过程而言，也是最优策略。

上述推论称为最优化原理，它给出了最优策略的必要条件，通常略述为：不论过去的状态和决策如何，对于前面的决策形成的当前的状态而言，余下的各个决策必定构成最优策略。

根据基本定理的推论可以得到动态规划的基本方程：

其中

是决策过程的终端条件，

为一个已知函数。当xn+1只取固定的状态时称固定终端；当xn+1可在终端集合Xn+1中变动时称自由终端。最终要求的最优指标函数满足(10)式：

(9)式是一个递归公式，如果目标状态确定，当然可以直接利用该公式递归求出最优值（这种递归方法将在后文介绍，称作备忘录法），但是一般在实际应用中我们通常将该递归公式改为递推公式求解，这样一般效率会更高一些。

大秦魂不相信强盗悔忏，
只能用复仇雪耻的战争，
讨回我秦汉高贵的尊严。
强秦何曾看过六国脸色，
大汉何曾求过匈奴道歉？
用无坚不摧的滚滚铁骑，
踏平那敌国的巍峨宫殿！

分享到 淘江湖新浪 QQ微博 QQ空间开心人人豆瓣网易微博百度鲜果白社会飞信

离线414878523

OIFans入门选手

只看该作者 1 发表于: 2006-04-20

哦哦
哦

离线414878523

OIFans入门选手

只看该作者 2 发表于: 2006-04-20

哦哦哦哦哦哦

离线冰蓝色的风

OIFans入门选手

只看该作者 3 发表于: 2006-04-29

详细讲一下符号的意义行吗？？？？？

离线clwxzh57

OIFans复赛选手

只看该作者 4 发表于: 2007-07-03

谢谢了

离线swj05652

只看该作者 5 发表于: 2007-07-04

这种理论上的东西没用的真正用起来就不是这么一回事了

离线amyhab

OIFans复赛选手

只看该作者 6 发表于: 2007-10-13

非也非也,有时会用到的

To Be,Or not to be.That's a Question!!!!!!!

离线serenity

OIFans初赛选手

只看该作者 7 发表于: 2007-10-19

看不到图的说

离线jiaozida

OIFans入门选手

只看该作者 8 发表于: 2008-03-21

e^^^^^