智能车制作

 找回密码
 注册

扫一扫,访问微社区

查看: 2658|回复: 4
打印 上一主题 下一主题

[其他] 极大值原理

[复制链接]

0

主题

294

帖子

1

精华

功勋会员

Rank: 10Rank: 10Rank: 10

积分
4132

特殊贡献奖章

QQ
威望
2661
贡献
1407
兑换币
33
注册时间
2007-11-22
在线时间
32 小时
跳转到指定楼层
1#
发表于 2008-4-21 18:31:34 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
<A title=最优控制理论 href="http://xinmengling.bloghome.cn/wiki/&aelig;œ€&auml;&frac14;˜&aelig;Ž§&aring;ˆ&para;&ccedil;†è&reg;&ordm;"><FONT color=#008000 size=5 face=宋体>最优控制理论</FONT></A><FONT color=#008000 size=5 face=宋体>中用以确定使受控系统或运动过程的给定性能指标取极大或极小值的最优控制的主要方法。在工程领域中很大一类最优控制问题都可采用极大值原理所提供的方法和原则来定出最优控制的规律。在理论上,极大值原理还是最优控制理论形成和发展的基础。极大值原理是对分析力学中古典变分法的推广,能用于处理由于外力源的限制而使系统的输入(即控制)作用有约束的问题。极大值原理是20世纪50年代中期苏联学者</FONT><A class=new title=Л.С.庞特里亚金 href="http://www.wiki.cn/w/index.php?title=%D0%9B.%D0%A1.%E5%BA%9E%E7%89%B9%E9%87%8C%E4%BA%9A%E9%87%91&amp;action=edit"><FONT color=#008000 size=5 face=宋体>Л.С.庞特里亚金</FONT></A><FONT color=#008000 size=5 face=宋体>提出的,有关这一原理的主要结果及其严格的数学证明,都发表在后来出版的《最优过程的数学理论》一书中。 </FONT><><FONT color=#008000 size=5 face=宋体>  <STRONG>最优控制问题</STRONG>  最优控制问题是从大量的工程实际问题(特别是航天和航空技术问题)中提炼出来的一个控制理论问题。最优控制问题有四个要素。 </FONT></P><P><FONT color=#008000 size=5 face=宋体>  ① 受控系统或过程的数学模型 通常采用状态方程(见</FONT><A title=状态空间法 href="http://xinmengling.bloghome.cn/wiki/&ccedil;Š&para;&aelig;€&ccedil;&copy;&ordm;é—&acute;&aelig;&sup3;•"><FONT color=#008000 size=5 face=宋体>状态空间法</FONT></A><FONT color=#008000 size=5 face=宋体>)的形式,它是状态向量x的一阶微分方程夶=f(x,u,t),其中u为控制向量,t为时间变量。在最一般的情况下,受控系统是非线性(见</FONT><A title=非线性控制系统 href="http://xinmengling.bloghome.cn/wiki/非&ccedil;&ordm;&iquest;&aelig;€§&aelig;Ž§&aring;ˆ&para;&ccedil;&sup3;&raquo;&ccedil;&raquo;Ÿ"><FONT color=#008000 size=5 face=宋体>非线性控制系统</FONT></A><FONT color=#008000 size=5 face=宋体>)和时变(见</FONT><A title=时变系统 href="http://xinmengling.bloghome.cn/wiki/&aelig;—&para;&aring;˜&ccedil;&sup3;&raquo;&ccedil;&raquo;Ÿ"><FONT color=#008000 size=5 face=宋体>时变系统</FONT></A><FONT color=#008000 size=5 face=宋体>)的,所以f(x,u,t)为非线性和时变的向量函数。 </FONT></P><P><FONT color=#008000 size=5 face=宋体>  ② 容许控制 工程实际因素的限制决定了控制器的允许类型。一个容许控制只能在控制的容许类中选取。用U表示系统的控制的允许类,则在数学上可将容许控制u表示为u∈U。通常U受到封闭性的边界限制。 </FONT></P><P><FONT color=#008000 size=5 face=宋体>  ③ 目标集 在控制作用下系统状态所要达到的目标区。这个目标区可以是一个给定的点,也可以是一个给定的区域。用 t<SUB>f</SUB>表示运动过程的末时刻,x(t<SUB>f</SUB>)表示末时刻系统的状态,则目标集常可用向量等式g<SUB>1</SUB>(x(t<SUB>f</SUB>),t<SUB>f</SUB>)=0、向量不等式g<SUB>2</SUB>(x(t<SUB>f</SUB>),t<SUB>f</SUB>)≤0来描述。 </FONT></P><P><FONT color=#008000 size=5 face=宋体>  ④ 性能指标 反映和评价系统性能优劣的指标。性能指标的形式由实际问题来决定,通常有两种类型:表示系统在末时刻状态的性能指标称为末值型性能指标,记为S(x(t<SUB>f</SUB>),t<SUB>f</SUB>);用特定函数的积分表示系统运动过程中的性能的指标称为积分型性能指标,记为 </FONT></P><P><A class=image title=Image:201-03_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:201-03_2.jpg"><FONT color=#008000 size=5 face=宋体><IMG border=0 alt=Image:201-03_2.jpg src="http://image1.wiki.cn/wi/f/f4/201-03_2.jpg" width=93 height=35></FONT></A><FONT color=#008000 size=5 face=宋体> </FONT></P><P><FONT color=#008000 size=5 face=宋体>其中t<SUB>0</SUB>为初始时刻。性能指标的一般形式为 </FONT></P><P><A class=image title=Image:201-04_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:201-04_2.jpg"><FONT color=#008000 size=5 face=宋体><IMG border=0 alt=Image:201-04_2.jpg src="http://image1.wiki.cn/wi/3/3e/201-04_2.jpg" width=244 height=40></FONT></A><FONT color=#008000 size=5 face=宋体> </FONT></P><P><FONT color=#008000 size=5 face=宋体>称为混合型性能指标。性能指标值的大小依赖于控制作用的整体u(·)的选择,而不是取决于控制u在t时刻的值;因此J[u(·)]是控制函数u(·)的函数(称为u(·)的泛函)。 </FONT></P><P><FONT color=#008000 size=5 face=宋体>  最优控制问题可表述为:寻求一个容许控制u(t),以使受控系统从某个给定的初始状态x(t<SUB>0</SUB>)=x<SUB>0</SUB>出发,在末时刻t<SUB>f</SUB>达到目标集,并且使性能指标泛函J[u(·)]达到极小值或极大值。如果这个问题是有解的,那么就称求得的容许控制为最优控制,记为u*(t);而系统状态方程在u*(t)作用下的解称为最优轨线,记为x*(t);相应的极小或极大性能指标值J[u*(·)],称为最优指标值。在数学上,最优控制问题的实质,是对受约束的泛函J[u(·)]求极值的问题,其中的约束条件为系统的状态方程、目标集方程和容许控制域。 </FONT></P><P><FONT color=#008000 size=5 face=宋体>  极大值原理的基本形式  对于定常系统的最优控制问题的极大值原理可表述如下:如果最优控制问题的数学模型为:受控系统夶=f(x,u),x(t<SUB>0</SUB>) =x<SUB>0</SUB>,t∈[t<SUB>0</SUB>,t<SUB>f</SUB>] </FONT></P><P><FONT color=#008000 size=5 face=宋体>目标集g<SUB>1</SUB>(x(t<SUB>f</SUB>))=0 ,g<SUB>2</SUB>(x(t<SUB>f</SUB>))≤0 </FONT></P><P><FONT color=#008000 size=5 face=宋体>容许控制u∈U </FONT></P><P><FONT color=#008000 size=5 face=宋体>性能指标J[u(·)]=S(x(t<SUB>f</SUB>)) </FONT></P><P><FONT color=#008000 size=5 face=宋体>末时刻t<SUB>f</SUB>自由 </FONT></P><P><FONT color=#008000 size=5 face=宋体>则u*(t)为最优控制、x*(t)为最优轨线和t<SUB>f</SUB>为最优末时刻的必要条件有五项。 </FONT></P><P><FONT color=#008000 size=5 face=宋体>  ① x*(t)满足方程 </FONT></P><P><A class=image title=Image:202-02_3.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-02_3.jpg"><FONT color=#008000 size=5 face=宋体><IMG border=0 alt=Image:202-02_3.jpg src="http://image1.wiki.cn/wi/c/cc/202-02_3.jpg" width=298 height=32></FONT></A><FONT color=#008000 size=5 face=宋体> </FONT></P><P><FONT color=#008000 size=5 face=宋体>  ② λ(t)满足方程 </FONT></P><P><A class=image title=Image:202-03_3.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-03_3.jpg"><FONT color=#008000 size=5 face=宋体><IMG border=0 alt=Image:202-03_3.jpg src="http://image1.wiki.cn/wi/f/f2/202-03_3.jpg" width=141 height=46></FONT></A><FONT color=#008000 size=5 face=宋体> </FONT></P><P><FONT color=#008000 size=5 face=宋体>式中</FONT><A class=image title=Image:202-04_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-04_2.jpg"><FONT color=#008000 size=5 face=宋体><IMG border=0 alt=Image:202-04_2.jpg src="http://image1.wiki.cn/wi/5/57/202-04_2.jpg" width=180 height=29></FONT></A><FONT color=#008000 size=5 face=宋体>称为给定问题的哈密顿函数,λ<SUP>T</SUP>(t)为λ(t)的转置。λ(t)称为状态x(t)的伴随状态,而其方程称为伴随方程。  </FONT></P><P><FONT color=#008000 size=5 face=宋体>  ③ λ(t<SUB>f</SUB>)满足方程 </FONT></P><P><A class=image title=Image:202-05_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-05_2.jpg"><FONT color=#008000 size=5 face=宋体><IMG border=0 alt=Image:202-05_2.jpg src="http://image1.wiki.cn/wi/4/4f/202-05_2.jpg" width=296 height=97></FONT></A><FONT color=#008000 size=5 face=宋体> </FONT></P><P><FONT color=#008000 size=5 face=宋体>式中μ<SUB>0</SUB>≥0为标量,μ和v为向量,它们是不全为零的待定量,且有vg<SUB>2</SUB>(x*(t<SUB>f</SUB>))=0,通常称此条件为横截条件。 </FONT></P><P><FONT color=#008000 size=5 face=宋体>  ④ u*(t)满足条件 </FONT></P><P><A class=image title=Image:202-06_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-06_2.jpg"><FONT color=#008000 size=5 face=宋体><IMG border=0 alt=Image:202-06_2.jpg src="http://image1.wiki.cn/wi/7/75/202-06_2.jpg" width=209 height=27></FONT></A><FONT color=#008000 size=5 face=宋体> </FONT></P><P><FONT color=#008000 size=5 face=宋体>  ⑤ 确定t壚的方程为 </FONT></P><P><A class=image title=Image:202-07.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-07.jpg"><FONT color=#008000 size=5 face=宋体><IMG border=0 alt=Image:202-07.jpg src="http://image1.wiki.cn/wi/5/5e/202-07.jpg" width=372 height=30></FONT></A><FONT color=#008000 size=5 face=宋体> </FONT></P><P><FONT color=#008000 size=5 face=宋体>  极大值原理的名称就来自于条件④。据此定出最优控制u*(t)的关系式后,最优控制问题的求解就归结为对运动方程及其初始条件 x(t<SUB>0</SUB>)和伴随方程及其末时刻条件λ(t<SUB>f</SUB>)联合求解,这种问题称为两点边值问题。更一般形式的最优控制问题(包括受控过程为时变系统、性能指标为积分型指标或混合型指标、末状态的约束方程为更复杂的形式等情况)的极大值原理的结果都可由上述基本形式导出。 </FONT></P><P><FONT color=#008000 size=5 face=宋体>  <STRONG>最优控制的类型</STRONG>  在一般情况下,由极大值原理定出的最优控制是时间变量t的函数u*(t),称为程序控制或开环控制。程序控制的主要缺点,是不能消除或抑制由于参数的变动和环境的变化对系统造成的扰动。最优控制的另一类形式是表示为状态变量x*(t)的函数u*(x*),实质上是一种</FONT><A title=状态反馈 href="http://xinmengling.bloghome.cn/wiki/&ccedil;Š&para;&aelig;€&aring;é&brvbar;ˆ"><FONT color=#008000 size=5 face=宋体>状态反馈</FONT></A><FONT color=#008000 size=5 face=宋体>,称为综合控制或闭环控制,其优点是对抑制扰动有利。原则上极大值原理能够用来确定综合控制形式的最优控制,但除了一些典型的最优控制问题外,对于一般的情况决定综合控制往往相当困难。在工程领域中,最为常见的一种综合控制形式是所谓的砰-砰控制。在这类控制形式中,根据系统的运动状况,最优控制u*的各个控制变量在整个过程中分段地取为容许控制范围的正最大值或负最大值。砰-砰控制的原理是把最优控制问题归结为:将状态空间划分为两个区域,一个区域对应于控制变量取正最大值,另一个区域对应于控制变量取负最大值。这两个区域的分界面称为开关面,而决定砰-砰控制的具体形式的关键就是决定开关面。砰-砰控制形式的最优控制常用于</FONT><A title=最速控制系统 href="http://xinmengling.bloghome.cn/wiki/&aelig;œ€é€Ÿ&aelig;Ž§&aring;ˆ&para;&ccedil;&sup3;&raquo;&ccedil;&raquo;Ÿ"><FONT color=#008000 size=5 face=宋体>最速控制系统</FONT></A><FONT color=#008000 size=5 face=宋体>和</FONT><A title=最省燃料控制系统 href="http://xinmengling.bloghome.cn/wiki/&aelig;œ€&ccedil;œ&ccedil;‡ƒ&aelig;–™&aelig;Ž§&aring;ˆ&para;&ccedil;&sup3;&raquo;&ccedil;&raquo;Ÿ"><FONT color=#008000 size=5 face=宋体>最省燃料控制系统</FONT></A><FONT color=#008000 size=5 face=宋体>。在正常情况下,砰-砰控制的控制变量由正最大值跃变到负最大值的次数是有限的,只有在跃变瞬时控制变量可取值于限制范围的任何值。但对于某些问题,砰-砰控制中至少存在一个时间区间,其中控制变量可取为限制范围的任意值,这类问题称为奇异最优控制问题。对于奇异最优控制问题,仅由极大值原理的条件还不足以确定奇异时间区间内的最优控制u*与最优轨线x*间的关系即综合控制的形式。 </FONT></P><P><FONT color=#008000 size=5 face=宋体>  <STRONG>LQ 问题</STRONG>   线性二次型性能指标的最优控制问题。在LQ问题中,受控系统为线性系统,运动方程具有形式夶=A(t)x+B(t)u;性能指标是状态x和控制u的一个二次型函数的积分,可表示为 </FONT></P><P><A class=image title=Image:202-08.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-08.jpg"><FONT color=#008000 size=5 face=宋体><IMG border=0 alt=Image:202-08.jpg src="http://image1.wiki.cn/wi/9/94/202-08.jpg" width=307 height=77></FONT></A><FONT color=#008000 size=5 face=宋体> </FONT></P><P><FONT color=#008000 size=5 face=宋体>其中加权阵S和Q为半正定对称阵,R为正定对称阵;控制u的各个控制变量的取值范围不受限制。根据极大值原理很容易定出LQ问题的最优控制 </FONT></P><P><A class=image title=Image:202-09.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-09.jpg"><FONT color=#008000 size=5 face=宋体><IMG border=0 alt=Image:202-09.jpg src="http://image1.wiki.cn/wi/2/2c/202-09.jpg" width=243 height=25></FONT></A><FONT color=#008000 size=5 face=宋体> </FONT></P><P><FONT color=#008000 size=5 face=宋体>它是一种线性状态反馈形式的综合控制。其中R<SUP>-1</SUP>表示矩阵R的逆,B<SUP>T</SUP>(t)表示矩阵B(t)的转置,而P(t)为正定对称矩阵,是如下的矩阵黎卡提微分方程的解: </FONT></P><P><A class=image title=Image:202-10_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-10_2.jpg"><FONT color=#008000 size=5 face=宋体><IMG border=0 alt=Image:202-10_2.jpg src="http://image1.wiki.cn/wi/2/24/202-10_2.jpg" width=272 height=87></FONT></A><FONT color=#008000 size=5 face=宋体> </FONT></P><P><FONT color=#008000 size=5 face=宋体>在工程领域中,很多情况下受控系统是定常系统,即其运动方程为夶=Ax+Bu,且取初时刻t<SUB>0</SUB>=0,而末时刻t<SUB>f</SUB>=∞,性能指标泛函为 </FONT></P><P><A class=image title=Image:202-11_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-11_2.jpg"><FONT color=#008000 size=5 face=宋体><IMG border=0 alt=Image:202-11_2.jpg src="http://image1.wiki.cn/wi/3/3b/202-11_2.jpg" width=294 height=44></FONT></A><FONT color=#008000 size=5 face=宋体> </FONT></P><P><FONT color=#008000 size=5 face=宋体>这时只要矩阵对(A,B)为能控(见</FONT><A title=能控性 href="http://xinmengling.bloghome.cn/wiki/èƒ&frac12;&aelig;Ž§&aelig;€§"><FONT color=#008000 size=5 face=宋体>能控性</FONT></A><FONT color=#008000 size=5 face=宋体>),矩阵对(A,C)为能观测(见</FONT><A title=能观测性 href="http://xinmengling.bloghome.cn/wiki/èƒ&frac12;观&aelig;&micro;‹&aelig;€§"><FONT color=#008000 size=5 face=宋体>能观测性</FONT></A><FONT color=#008000 size=5 face=宋体>),其中C为由分解Q=CC<SUP>T</SUP>导出的矩阵,那么最优控制u*=-Kx*具有状态x*的线性定常反馈的形式,反馈矩阵K=R<SUP>-1</SUP>B<SUP>T</SUP>P,P为如下的矩阵黎卡提代数方程的解: </FONT></P><P><A class=image title=Image:202-12_2.jpg href="http://xinmengling.bloghome.cn/wiki/Image:202-12_2.jpg"><FONT color=#008000 size=5 face=宋体><IMG border=0 alt=Image:202-12_2.jpg src="http://image1.wiki.cn/wi/3/39/202-12_2.jpg" width=232 height=29></FONT></A><FONT color=#008000 size=5 face=宋体> </FONT></P><P><FONT color=#008000 size=5 face=宋体>这类控制问题的优点是反馈矩阵K为常数,可由计算机事先通过计算定出,不必在控制系统中引入计算机进行实时控制。LQ问题在工程上常称为线性调节器问题。 </FONT></P><P><FONT color=#008000 size=5 face=宋体>  <STRONG>次优控制</STRONG>  对于较为复杂的受控系统,即使系统为线性的情况,最优控制问题的求解也常有大量的计算。采用次优控制,可在保证性能指标值足够接近最优性能值的同时,显著地减少问题求解的计算量。实现次优控制的主要的途径是把复杂的受控系统通过适当的方法化为两个较为简单的子受控系统,并且针对子系统来计算最优控制,再综合地作必要的修正。实现系统分解的途径有非奇异摄动方法和奇异摄动方法。对控制函数的修正需按期望性能指标值对最优性能值的接近程度来确定;要求接近的程度越高,修正计算量也就越大。特别是对于要求计算机实时控制的受控系统,为了避免过大的计算量或避免增加控制系统在组成上的复杂性,常常更宜采用次优控制以代替最优控制。 </FONT></P><P><FONT color=#008000 size=5 face=宋体>  <STRONG>极大值原理的推广</STRONG>  极大值原理不仅可用于解决连续形式的受控系统的最优控制问题,而且还被推广于处理离散形式的受控系统的最优控制问题。离散最优控制问题的极大值原理称为离散极大值原理。极大值原理对求解分布参数系统的最优控制问题也很有效,相应的方法称为分布参数系统的极大值原理。 </FONT></P>

0

主题

294

帖子

1

精华

功勋会员

Rank: 10Rank: 10Rank: 10

积分
4132

特殊贡献奖章

QQ
威望
2661
贡献
1407
兑换币
33
注册时间
2007-11-22
在线时间
32 小时
2#
 楼主| 发表于 2008-4-21 19:23:31 | 只看该作者

Re:极大值原理

在我们调试参数的时候,什么时候是最优的呢?这篇文章对这个问题会给你一定的帮助。
回复 支持 反对

使用道具 举报

21

主题

1019

帖子

0

精华

常驻嘉宾

我爱雯婕

Rank: 8Rank: 8

积分
4657
威望
2223
贡献
1682
兑换币
4
注册时间
2009-3-4
在线时间
376 小时
3#
发表于 2009-4-3 13:05:03 | 只看该作者
现在才知到高数是多么的有用
回复 支持 反对

使用道具 举报

1

主题

58

帖子

0

精华

中级会员

Rank: 3Rank: 3

积分
401
威望
315
贡献
76
兑换币
20
注册时间
2010-2-6
在线时间
5 小时
4#
发表于 2010-2-18 17:52:56 | 只看该作者
是啊
回复 支持 反对

使用道具 举报

6

主题

50

帖子

0

精华

金牌会员

Rank: 6Rank: 6

积分
1136
威望
338
贡献
746
兑换币
22
注册时间
2009-12-4
在线时间
26 小时
5#
发表于 2010-5-19 23:05:08 | 只看该作者
好东西啊
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们|联系我们|小黑屋|智能车制作 ( 黑ICP备2022002344号

GMT+8, 2024-9-21 16:22 , Processed in 0.136058 second(s), 30 queries , Gzip On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表