极大值原理

superyongzhe · 发表于 2008-4-21 18:31:34

<A title=最优控制理论 href="http://xinmengling.bloghome.cn/wiki/æœ€ä¼˜æŽ§åˆ¶ç†è®º">最优控制理论</A>中用以确定使受控系统或运动过程的给定性能指标取极大或极小值的最优控制的主要方法。在工程领域中很大一类最优控制问题都可采用极大值原理所提供的方法和原则来定出最优控制的规律。在理论上，极大值原理还是最优控制理论形成和发展的基础。极大值原理是对分析力学中古典变分法的推广，能用于处理由于外力源的限制而使系统的输入（即控制）作用有约束的问题。极大值原理是20世纪50年代中期苏联学者<A class=new title=Л.С.庞特里亚金 href="http://www.wiki.cn/w/index.php?title=%D0%9B.%D0%A1.%E5%BA%9E%E7%89%B9%E9%87%8C%E4%BA%9A%E9%87%91&action=edit">Л.С.庞特里亚金</A>提出的，有关这一原理的主要结果及其严格的数学证明，都发表在后来出版的《最优过程的数学理论》一书中。 <

>　　最优控制问题 　最优控制问题是从大量的工程实际问题（特别是航天和航空技术问题）中提炼出来的一个控制理论问题。最优控制问题有四个要素。 　　①　受控系统或过程的数学模型　通常采用状态方程（见<A title=状态空间法 href="http://xinmengling.bloghome.cn/wiki/çŠ¶æ€ç©ºé—´æ³•">状态空间法</A>）的形式,它是状态向量x的一阶微分方程夶=f(x,u,t)，其中u为控制向量,t为时间变量。在最一般的情况下,受控系统是非线性(见<A title=非线性控制系统 href="http://xinmengling.bloghome.cn/wiki/éžçº¿æ€§æŽ§åˆ¶ç³»ç»Ÿ">非线性控制系统</A>)和时变（见<A title=时变系统 href="http://xinmengling.bloghome.cn/wiki/æ—¶å˜ç³»ç»Ÿ">时变系统</A>）的，所以f(x,u,t)为非线性和时变的向量函数。 　　②　容许控制　工程实际因素的限制决定了控制器的允许类型。一个容许控制只能在控制的容许类中选取。用U表示系统的控制的允许类,则在数学上可将容许控制u表示为u∈U。通常U受到封闭性的边界限制。 　　③　目标集　在控制作用下系统状态所要达到的目标区。这个目标区可以是一个给定的点,也可以是一个给定的区域。用 tf表示运动过程的末时刻,x(tf)表示末时刻系统的状态,则目标集常可用向量等式g1(x(tf),tf)=0、向量不等式g2(x(tf),tf)≤0来描述。 　　④　性能指标　反映和评价系统性能优劣的指标。性能指标的形式由实际问题来决定,通常有两种类型:表示系统在末时刻状态的性能指标称为末值型性能指标，记为S(x(tf),tf);用特定函数的积分表示系统运动过程中的性能的指标称为积分型性能指标，记为 <A class=image title=Image:201-03_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:201-03_2.jpg"><IMG border=0 alt=Image:201-03_2.jpg src="http://image1.wiki.cn/wi/f/f4/201-03_2.jpg" width=93 height=35></A> 其中t0为初始时刻。性能指标的一般形式为 <A class=image title=Image:201-04_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:201-04_2.jpg"><IMG border=0 alt=Image:201-04_2.jpg src="http://image1.wiki.cn/wi/3/3e/201-04_2.jpg" width=244 height=40></A> 称为混合型性能指标。性能指标值的大小依赖于控制作用的整体u(·)的选择,而不是取决于控制u在t时刻的值；因此J[u(·)]是控制函数u(·)的函数（称为u(·)的泛函）。 　　最优控制问题可表述为:寻求一个容许控制u(t),以使受控系统从某个给定的初始状态x(t0)=x0出发,在末时刻tf达到目标集，并且使性能指标泛函J[u(·)]达到极小值或极大值。如果这个问题是有解的，那么就称求得的容许控制为最优控制,记为u*(t)；而系统状态方程在u*(t)作用下的解称为最优轨线,记为x*(t);相应的极小或极大性能指标值J[u*(·)],称为最优指标值。在数学上，最优控制问题的实质，是对受约束的泛函J[u(·)]求极值的问题，其中的约束条件为系统的状态方程、目标集方程和容许控制域。 　　极大值原理的基本形式　对于定常系统的最优控制问题的极大值原理可表述如下：如果最优控制问题的数学模型为：受控系统夶=f(x，u)，x(t0) =x0,t∈[t0,tf] 目标集g1(x(tf))=0 ，g2(x(tf))≤0 容许控制u∈U 性能指标J[u(·)]＝S(x(tf)) 末时刻tf自由 则u*(t)为最优控制、x*(t)为最优轨线和tf为最优末时刻的必要条件有五项。 　　①　x*(t)满足方程 <A class=image title=Image:202-02_3.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-02_3.jpg"><IMG border=0 alt=Image:202-02_3.jpg src="http://image1.wiki.cn/wi/c/cc/202-02_3.jpg" width=298 height=32></A> 　　②　λ(t)满足方程 <A class=image title=Image:202-03_3.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-03_3.jpg"><IMG border=0 alt=Image:202-03_3.jpg src="http://image1.wiki.cn/wi/f/f2/202-03_3.jpg" width=141 height=46></A> 式中<A class=image title=Image:202-04_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-04_2.jpg"><IMG border=0 alt=Image:202-04_2.jpg src="http://image1.wiki.cn/wi/5/57/202-04_2.jpg" width=180 height=29></A>称为给定问题的哈密顿函数，λT(t)为λ(t)的转置。λ(t)称为状态x(t)的伴随状态，而其方程称为伴随方程。　 　　③　λ(tf)满足方程 <A class=image title=Image:202-05_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-05_2.jpg"><IMG border=0 alt=Image:202-05_2.jpg src="http://image1.wiki.cn/wi/4/4f/202-05_2.jpg" width=296 height=97></A> 式中μ0≥0为标量,μ和v为向量，它们是不全为零的待定量，且有vg2(x*(tf))=0，通常称此条件为横截条件。 　　④　u*(t)满足条件 <A class=image title=Image:202-06_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-06_2.jpg"><IMG border=0 alt=Image:202-06_2.jpg src="http://image1.wiki.cn/wi/7/75/202-06_2.jpg" width=209 height=27></A> 　　⑤　确定t壚的方程为 <A class=image title=Image:202-07.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-07.jpg"><IMG border=0 alt=Image:202-07.jpg src="http://image1.wiki.cn/wi/5/5e/202-07.jpg" width=372 height=30></A> 　　极大值原理的名称就来自于条件④。据此定出最优控制u*(t)的关系式后,最优控制问题的求解就归结为对运动方程及其初始条件 x(t0)和伴随方程及其末时刻条件λ(tf)联合求解,这种问题称为两点边值问题。更一般形式的最优控制问题（包括受控过程为时变系统、性能指标为积分型指标或混合型指标、末状态的约束方程为更复杂的形式等情况）的极大值原理的结果都可由上述基本形式导出。 　　最优控制的类型 　在一般情况下，由极大值原理定出的最优控制是时间变量t的函数u*(t)，称为程序控制或开环控制。程序控制的主要缺点，是不能消除或抑制由于参数的变动和环境的变化对系统造成的扰动。最优控制的另一类形式是表示为状态变量x*(t)的函数u*(x*)，实质上是一种<A title=状态反馈 href="http://xinmengling.bloghome.cn/wiki/çŠ¶æ€åé¦ˆ">状态反馈</A>，称为综合控制或闭环控制，其优点是对抑制扰动有利。原则上极大值原理能够用来确定综合控制形式的最优控制，但除了一些典型的最优控制问题外，对于一般的情况决定综合控制往往相当困难。在工程领域中，最为常见的一种综合控制形式是所谓的砰－砰控制。在这类控制形式中，根据系统的运动状况，最优控制u*的各个控制变量在整个过程中分段地取为容许控制范围的正最大值或负最大值。砰－砰控制的原理是把最优控制问题归结为：将状态空间划分为两个区域，一个区域对应于控制变量取正最大值，另一个区域对应于控制变量取负最大值。这两个区域的分界面称为开关面,而决定砰-砰控制的具体形式的关键就是决定开关面。砰－砰控制形式的最优控制常用于<A title=最速控制系统 href="http://xinmengling.bloghome.cn/wiki/æœ€é€ŸæŽ§åˆ¶ç³»ç»Ÿ">最速控制系统</A>和<A title=最省燃料控制系统 href="http://xinmengling.bloghome.cn/wiki/æœ€çœç‡ƒæ–™æŽ§åˆ¶ç³»ç»Ÿ">最省燃料控制系统</A>。在正常情况下,砰-砰控制的控制变量由正最大值跃变到负最大值的次数是有限的，只有在跃变瞬时控制变量可取值于限制范围的任何值。但对于某些问题，砰-砰控制中至少存在一个时间区间,其中控制变量可取为限制范围的任意值，这类问题称为奇异最优控制问题。对于奇异最优控制问题，仅由极大值原理的条件还不足以确定奇异时间区间内的最优控制u*与最优轨线x*间的关系即综合控制的形式。 　　LQ 问题 　线性二次型性能指标的最优控制问题。在LQ问题中，受控系统为线性系统，运动方程具有形式夶＝A(t)x+B(t)u；性能指标是状态x和控制u的一个二次型函数的积分，可表示为 <A class=image title=Image:202-08.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-08.jpg"><IMG border=0 alt=Image:202-08.jpg src="http://image1.wiki.cn/wi/9/94/202-08.jpg" width=307 height=77></A> 其中加权阵S和Q为半正定对称阵,R为正定对称阵；控制u的各个控制变量的取值范围不受限制。根据极大值原理很容易定出LQ问题的最优控制 <A class=image title=Image:202-09.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-09.jpg"><IMG border=0 alt=Image:202-09.jpg src="http://image1.wiki.cn/wi/2/2c/202-09.jpg" width=243 height=25></A> 它是一种线性状态反馈形式的综合控制。其中R-1表示矩阵R的逆，BT(t)表示矩阵B(t)的转置，而P(t)为正定对称矩阵，是如下的矩阵黎卡提微分方程的解： <A class=image title=Image:202-10_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-10_2.jpg"><IMG border=0 alt=Image:202-10_2.jpg src="http://image1.wiki.cn/wi/2/24/202-10_2.jpg" width=272 height=87></A> 在工程领域中，很多情况下受控系统是定常系统，即其运动方程为夶=Ax+Bu,且取初时刻t0=0,而末时刻tf＝∞，性能指标泛函为 <A class=image title=Image:202-11_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-11_2.jpg"><IMG border=0 alt=Image:202-11_2.jpg src="http://image1.wiki.cn/wi/3/3b/202-11_2.jpg" width=294 height=44></A> 这时只要矩阵对(A，B)为能控(见<A title=能控性 href="http://xinmengling.bloghome.cn/wiki/èƒ½æŽ§æ€§">能控性</A>)，矩阵对(A，C)为能观测（见<A title=能观测性 href="http://xinmengling.bloghome.cn/wiki/èƒ½è§‚æµ‹æ€§">能观测性</A>），其中C为由分解Q=CCT导出的矩阵，那么最优控制u*=-Kx*具有状态x*的线性定常反馈的形式，反馈矩阵K=R-1BTP，P为如下的矩阵黎卡提代数方程的解： <A class=image title=Image:202-12_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-12_2.jpg"><IMG border=0 alt=Image:202-12_2.jpg src="http://image1.wiki.cn/wi/3/39/202-12_2.jpg" width=232 height=29></A> 这类控制问题的优点是反馈矩阵K为常数,可由计算机事先通过计算定出，不必在控制系统中引入计算机进行实时控制。LQ问题在工程上常称为线性调节器问题。 　　次优控制 　对于较为复杂的受控系统，即使系统为线性的情况，最优控制问题的求解也常有大量的计算。采用次优控制，可在保证性能指标值足够接近最优性能值的同时，显著地减少问题求解的计算量。实现次优控制的主要的途径是把复杂的受控系统通过适当的方法化为两个较为简单的子受控系统，并且针对子系统来计算最优控制，再综合地作必要的修正。实现系统分解的途径有非奇异摄动方法和奇异摄动方法。对控制函数的修正需按期望性能指标值对最优性能值的接近程度来确定；要求接近的程度越高，修正计算量也就越大。特别是对于要求计算机实时控制的受控系统，为了避免过大的计算量或避免增加控制系统在组成上的复杂性，常常更宜采用次优控制以代替最优控制。 　　极大值原理的推广 　极大值原理不仅可用于解决连续形式的受控系统的最优控制问题，而且还被推广于处理离散形式的受控系统的最优控制问题。离散最优控制问题的极大值原理称为离散极大值原理。极大值原理对求解分布参数系统的最优控制问题也很有效，相应的方法称为分布参数系统的极大值原理。

superyongzhe · 发表于 2008-4-21 19:23:31

在我们调试参数的时候，什么时候是最优的呢？这篇文章对这个问题会给你一定的帮助。

chenrunshe_007 · 发表于 2009-4-3 13:05:03

现在才知到高数是多么的有用

尖刀阿利亚 · 发表于 2010-2-18 17:52:56

是啊

zhixiaolei · 发表于 2010-5-19 23:05:08

好东西啊

		自动登录	找回密码
密码			注册

[其他] 极大值原理

Re:极大值原理

特殊贡献奖章