最適制御

出典: フリー百科事典『ウィキペディア(Wikipedia)』

出典: フリー百科事典『ウィキペディア(Wikipedia)』

最適制御(さいてきせいぎょ、: optimal control)の理論は、場合によれば制約条件のもとで、性能の判別値を最小化(もしくは最大化)させるところのひとつの系の制御を決定するのを、可能にする。人はその状態における同じ型の制約条件を検討に加えるがしかし、さらに古典的な(さらに加えて単純な)場合にはその制御における不等式の形の制約条件のものになる。この理論は変分法における一般化のひとつである。それらは二つの面の組み合わせである:

最適制御の理論はオートメーション工学フランス語版ならびに応用数学(もしくは処理工程の数理最適化)の一部をなす。変分法の一般化としてのこの理論において、それらは数理物理学における応用のひとつの分野であり、そして純粋数学の合流の現代の理論の進展の結果でもある。

歴史[編集]

最近の研究業績はまず最初に、根本的な修正なしに二つのアプローチの一般化をもつ;それはフランク・H.クラークが導入した一般化された勾配: gradients généralisés)(もしくは一般化された微分: differentielles généralisés〉)を用いた、この研究者による滑らかでない解析: analyse non lisse)の枠組みにおける微分可能性の制約を弱めた方向を巡る良い部分についてである[3][4][5]。ポントリャーギンと彼の共同者の元の理論における断片の連続関数のもののところよりもより一般の自然な制御におけるふるまいをそれらは持つ:とりわけルベーグ可測関数。別のひとつの門脈の拡張としての遅れを伴った系[6]ならびに無限次元におけるさらなる一般化がある[7]。他方では、特殊な数学のテクニックのこの終わりからの展開をもった後の地味な時期に、ボルチャンスキーは系についての最大値原理のひとつの弱い版の結果をもたらした[8]、けれどもカルーシュ・クーン・タッカー条件から出たその結果の難しさなしに人は証明を与える[9]凸集合の一定の条件のもとで、系のこのタイプについての真の最大値の原理を人はしかしながら認める[10]

最大原理と動的計画法:相違と類似[編集]

元来、ポントリャーギンの最大原理は最適性におけるひとつの必要条件である、一方で、動的計画法はひとつの十分条件を提供する。他方では、動的計画法は(系における状態の関数の)ひとつの閉じたループ フランス語版: boucle)上の制御でふるまうものであるのに、最大原理は(時間の関数の)ひとつの開じたループ上の解として与える。

しかしながら、最大原理の制御の解は、閉じたループにおけるひとつの制御の形から見た適用である、この好都合な場合において、与えられる。しかしながら、動的計画法における最大原理のひとつの大きな利点は、前者そのものが、(問題が<<重端での>>事柄によって、しかしながら酷く複雑であるものである分解の)常微分方程式のその分解であるままの場合に対し、後者が、(ハミルトン-ヤコビ-ベルマン方程式の)偏微分を通した或る方程式の分解を導く、連続な時間でのその系にそれらが適用される場合に、仕事での簡単さをさらに大きく付け加えることである。

動的計画法それ自体は確率的な系におけることと同じく決定的な系にも同じ程度に適用される。[2][11]しかしながら最大原理は(少しの例外をもって[12])決定論の場合のようには適用できない。

最適制御のための数値的方法[編集]

最適制御問題は一般的には非線形であり、したがって、線形二次最適制御問題英語版のような解析的な解をもたない、結果として、最適制御問題を解くような数値的方法を採用することが必要である。

間接法[編集]

およそ1950年代から1980年代までの最適制御の初期の年代では最適制御問題についてのもてはやされたアプローチは間接法: indirect method)だった。間接法では、その変分法は一次の最適条件を満たすよう採用される。これらの条件は二点(もしくは多点の、複合問題の場合)における境界値問題の結果を与える。この境界値問題はハミルトニアン英語版の微分をとることから実際には特殊な構造を有する。このようにして、力学系の結果は次の形のハミルトン系英語版である。

ここに

独立変数ハミルトニアン: argumented Hamiltonian)であって、間接法においては、境界値問題は適切な境界もしくは横断的な条件: transversality condition)を用いて解かれる。間接法を使うことの美しさは、状態ベクトルならびに随伴ベクトル(たとえば)が求める解とそれについての極軌道にたいして前もって確実に解けることである。間接法の欠点は(特に、時間間隔が長い問題や内点の制約条件のある問題について)その境界値問題を解くことがしばしば極端に難しくなることである。間接法を実装した有名なソフトウェア・プログラムはBNDSCO である。[13]

直接法[編集]

(たとえば、1980年代から現在までの)過去20年間における数値的な最適制御での峻峰へ登頂するアプローチは直接法: direct method)と呼ばれるものの事である。直接法では、その状態ならびに/や制御は(たとえば、多項式近似英語版: polynomial approximation)もしくは区分折線近似英語版: piecewise constant parameterization)での)適当な関数近似英語版を用いて近似される。同時に色々に使える費用は費用関数: cost function)として近似される。それ故、関数近似の係数は最適化の変数として扱われる、そして問題は次の形の非線形の最適化問題へと「書き直される」:

を最小化、ただしここで代数的制約:

を条件とする

非線形最適化問題の規模は(たとえば、直接ねらい撃ちするか、準線形の方法のようにして)極めで小さくできるか、(たとえば、擬スペクトル的最適制御英語版[14]のようにして)緩和されるか、もしくは(たとえば、直接選点法のように[15])極めて大きくなるかもしれない、採用した直接法の類型に依存する。後者の場合(例えば、選点法)、非線形最適化問題は文字通り千から十万の変数と制約条件になる。直接法から起こる、与えられる規模の大きさは、境界要素法を解くことよりも非線形最適化問題を解くことが易しいという、直観に多少反して現れるかもしれない。それは、しかしながら、境界要素法よりも非線形最適化問題(NLP)の方が解くことが易しいという事実である。計算の相対的な容易さについての理由、特に直接選点法は、NLPが疎ら(まばら、: sparse)であり、大規模なNLPを解くような多くの良く知られたソフトフェア・プログラム(例えば、SNOP英語版[16])が存在する、事である。結果として、(特に最近極めて普及したものである直接「選点法」の)直接法を通して解き得るものの問題の適用範囲は、間接法を通して解き得るものである問題の適用範囲よりも著しく大きい。

直接法のソフトウェア[編集]

事実として、直接法は最近それ程普及するようになったので、多くの人々はこれらの解法を採用する改善されたソフトウェアを書くようになった。特に、多くのプログラムの中にはDIRCOLSOCSOTISGESOP/ASTOS英語版[17]DITANPyGMO/PyKEPが含まれる。近年MATLABプログラミング言語の到来に従い、産業開発用MATLABツールの一例としてPROPT英語版[18]が在る折に、RIOTSDIDO英語版[19]DIRECTGPOPSを含む直接法を実装するMATLABソフトウェアツールでの最適制御ソフトウェア。これらのソフトウェア・ツールは学術研究、ならびに産業問題の両方についての複雑な最適制御問題を人々が探求するような機会を著しく増やした。結果として、CやFORTRANで既に可能であったよりも、著しく簡単にTOMLAB英語版のような汎用のMATLAB最適化環境で複雑な最適制御問題のコーディングをするようになった、ことは注目される。

関連項目[編集]

脚注[編集]

[ヘルプ]

参考文献[編集]

論文[編集]

  • Clarke, Frank H. (1976年). “The maximum Principle under Minimal Hypotheses”. SIAM J. Control Optim. 14 (6): 1078-1091. 
  • Haussmann, V. G. (1978年). “Onthe Stochastic Maximum Principle”. SIAM J. Control and Optimization 16 (2): 236-269. 
  • Ross, I. M.; Karpenko, M. (2012年). “A Review of Pseudospectral Optimal Control: From Theory to Flight”. Annual Reviews in Control 36 (2): 182-197. doi:10.1016/j.arcontrol.2012.09.002. 

書籍[編集]

  • Bellman, Richard (1957), Princeton University Press, ed., Dynamic Programming, ISBN 0486428095 
  • Betts, J. T. (2010). Practical Methods for Optimal Control Using Nonlinear Programming (2nd ed.). Philadelphia, Pennsylvania: SIAM Press. ISBN 978-0-89871-688-7. 
  • Boltyanskii, L. S. (1976), Commande optimale des systèmes discrets, Mir, pp. 467 
  • Bourlès, Henri (2004). “1.La commande optimale des systèmes dynamiques”. In H. AbouKandil (dir.). Principe du maximum. Hermès-Science. pp. 15-70. ISBN 2746209659. 
  • Clarke, Frank H. (1987), Optimization and Nonsmooth Analysis, Society for Industrial & Applied Mathematics, U. S., pp. 360, ISBN 0898712564 
  • Fleming, Wendell Helms; Rishel, Raymond W. (1975). Deterministic and Stochastic Optimal Control. Springer. p. 320. ISBN 3540901558. 
  • Gorecki, Henrik; Fuksa, Stanislaw; Korytowski, Adam (1989), Analysis and Synthesis of Time Delay Systems, John Wiley & Sons, pp. 382, ISBN 0471276227 
  • Li, Xunjing; Yong, Jiongmin (1994), Optimal Control Theory for Infinite Dimensional Systems, Birkhäuser, pp. 448, ISBN 0817637222 
  • Neustadt, Lucien W. (1976), Optimization, A, Theory of Cecessary Conditions, Princeton Univ. Press, pp. 440, ISBN 0691081417 
  • Oberle, H. J.; Grmm (1989), “BNDSCO - A Program for the Numerical Solution of Optimal Control Problems”, Institute for Flight Systems Dynamics (Oberpfaffenhofen: DLR) 
  • Pontryagin, L. S.; Boltyanskii, V. G.; Gamkrelidze, R. V.; Mishchenko, E. F. (1962), Interscience, ed., The Mathematical Theory of Optimal Processes, ISBN 2881240771 からの翻訳の
    最適制御の数学的理論. 文一総合出版. (1967-05). ISBN 978-4829920701. 
  • Vinter, Richard (2000), Optimal Control, Birkhäuser, ISBN 0817640754 

ソフトウェア関連[編集]

  • Gash, P. F.; Well, K. H. (2001), Trajectory Optimization Using a Combination of Direct Multiple Shoooting and Collocation, Montréal, québec, Canada 6-9 August 2001AIAA 2001-4047, AIAA Guidance, Navigation, and Control Conference 
  • Gill, P. E.; Murray, W. M; Saunders, M. A. (2007-04-24), “User's Manual for SNOPT Version 7: Software for Large-Scale Nonlinear Programming”, University of California, San Diego Report 
  • Ross, I. M.; Fahroo, F. (2002), “User's Manual for DIDO: A MATLAB Package for Dynamic Optimization”, Naval Postgraduate School Technical Report 
  • Rutquist, P.; Edvall, M. M., PROPT - MATLAB Optimal Control Software, 1260 S. E. Bishop Blvd Ste E, Pullman, WA 99163, USA: Tomlab Optimization, Inc.