6. 13. Метод динамического программирования как та

6.13. Метад дынамічнага праграмавання: як такой, яго сімвалізм і ўваходжанне ў практыку кіравання.

Метад дынамічнага праграмавання - адзін з фармальна-алгарытмічных метадаў аптымізацыі кіравання і вырашэння іншага роду задач, інтэрпрэтаваных ў якасці задач кіраванне. У выкладзе істносцi метаду дынамічнага праграмавання мы абапіраемся на кнігу "Курс тэорыі аўтаматычнага кіравання " (аўтар Палю дэ Ла Бар'ер: французскае выданне 1966 г., рускае выданне — «Машынабудаванне», 1973 г.), хоць і не паўтараем яго выкладу. Асобныя палажэнні ўзятыя з курсу "Даследаванне аперацый" Ю. П. Зайчанка (Кіеў «Вища школа», 1979 г.).
Метад дынамічнага праграмавання працаздольны, калі фармальная інтэрпрэтацыя рэальнай задачы дазваляе выканаць наступныя ўмовы:
1. Разгляданая задача можа быць прадстаўлена як N-крокавы працэс, апісваны суадносінамі:
Xn+1=f(Xn,Un,n), дзе n-нумар аднаго з мноства магчымых станаў сістэмы, у якое яна пераходзіць па завяршэнні n—нага кроку; Xn-вектар стану сістэмы, які належыць згаданаму n—ному мноству; Un-кіраванне, выпрацаванае на кроку n (крокавае кіраванне), якое перакладае сістэму з магчымага стану n-га мностве ў адно з станаў (n + 1)-га мноства. Каб гэта ўявіць наглядна, варта звярнуцца да мал. 6.13-1, аб якім гаворка пойдзе далей.
2. Структура задачы не павінна змяняцца пры змене разліковага колькасці крокаў N.
3. Памернасць прасторы параметраў, якімі апісваецца стан сістэмы, не павінна змяняцца ў залежнасці ад колькасці крокаў N.
4. Выбар кіравання на любым з крокаў не павінен адмаўляць выбару кіравання на папярэдніх кроках. Іншымі словамі, аптымальны выбар кіравання ў любым з магчымых станаў павінен вызначацца параметрамі разгляданага стану, а не параметрамі працэсу, у ходзе якога сістэма прыйшла ў разгляданая стан.
Чыста фармальна, калі аднаму стану адпавядаюць розныя перадгісторыі яго ўзнікнення, якія ўплываюць на наступны выбар аптымальнага кіравання, то метад дазваляе ўключыць апісання предгісторый ў вектар стану, што вядзе да павелічэння памернасці вектара стану сістэмы. Пасля гэтай аперацыі тое, што да яе апісвалася як адзін стан, становіцца мноствам станаў, якія адрозніваюцца адно ад адзінага кампанентамі вектара стану, якія апісваюць предгісторыю працэсу.
5. Крытэрый аптымальнага выбару паслядоўнасці крокавых упраўленняў Un і адпаведнай траекторыі ў прасторы фармальных параметраў мае выгляд:
V = V0(X0,U0)+V1(X1,U1)+…+VN—1(XN-1,UN—1)+VN(XN).
Крытэрый V прынята называць поўным выйгрышам, а складнікі якія ўваходзяць у яго — крокавымі выйграшаў. У задачы патрабуецца знайсці паслядоўнасць крокавых упраўленняў Un і траекторыю, якой адпавядае максімальны з магчымых поўных выйгрышаў. Па сваёй сутнасці поўны выйгрыш V - мера якасці кіравання працэсам у цэлым. Крокавыя выйгрышы, хоць і ўваходзяць у меру якасці кіравання працэсам у цэлым, але ў агульным выпадку не з'яўляюцца мерамі якасці кіравання на адпаведных ім кроках, паколькі метад прызначаны для аптымізацыі працэсу кіравання ў цэлым, а эфектнае крокавае кіравання з вялікім крокавым выйгрышам, але якія ляжаць па-за аптымальнай траекторыі, цікавасці не ўяўляюць. Структура метаду не забараняе пры неабходнасці на кожным кроку ўжываць крытэрый вызначэння крокавага выйгрышу Vn, выдатны ад крытэраў, прынятых на іншых кроках. Акрамя таго, крытэрый аптымальнасці можа быць пабудаваны і як сумма крокавых выйгрышаў, якія аднак у гэтым выпадку не павінны прымаць адмоўных значэнняў.
З індэксам n - паказальнікам-вызначальнікам мностваў магчымых вектараў стану - у рэальных задачах можа быць звязаны нейкі зменлівы параметр, напрыклад: час, пройдзены шлях, узровень магутнасці, мера расходавання нейкага рэсурсу і
т.п. гэта значыць метад выкарыстоўваецца і ў дачыненні не толькі для аптымізацыі кіравання працэсамі, якія доўжацца ў часе, але і да задач аптымізацыі шматварыянтнасць аднамомантавага або неадчувальнага да часу рашэння, калі такога роду "заўчасныя", "непроцессные" задачы дапускаюць іх шматкрокавую інтэрпрэтацыю.
Цяпер звернемся да мал.6.13-1 - мал.6.13-3, паўтаральным ўзаемна звязаныя мал.40,41,42 З курсу тэорыі аўтаматычнагf кіравання П.дэ Ла Бар'ера, хоць у ім яны інакш азагалоўлены.
На мал. 6.13-1 паказаны пачатковая стан сістэмы — «0» і мноства яе магчымых наступных станаў "1","2","3", а таксама магчымыя пераходы з кожнага магчымага стану ў іншыя магчымый стан. Усё гэта разам падобна на карту настольнай дзіцячай гульні, па якой перамяшчаюцца фішкі: кожнаму пераходу - кроку адпавядае свой крокавы выйгрыш, а у завяршальным працэс - трэцім мностве - кожнаму са станаў сістэмы нададзена яго ацэнка, змешчаная ў прамавугольніку. Прынцыповае адрозненне ад гульні ў тым, што варажба аб выбары шляху, якое ўжываецца ў дзіцячай гульні, на аснове кідання костак альбо кручэння Турка і т. п. , у рэальным кіраванні недапушчальна, паколькі гэта - перадача мэтазгоднага кіравання тым сілам, якія здольныя кіраваць выпадзеннем костак, кручэннем Турка і т. п., т. е. тым, для каго абраны ў гульні "Генератар выпадковасцяў" - досыць эфектыўна (у адносінах да іх мэтаў) прылада кіраванння.
Калі выбіраць аптымальнае кіраванне на першым кроку, то неабходна прадбачыць усе яго наступствы на наступных кроках. Таму апісанне алгарытму метаду дынамічнага праграмавання часта пачынаюць з апісання выбару кіравання на апошнім кроку, які вядзе ў адно з завяршальных працэс станаў. Пры гэтым спасылаюцца на «педагагічную практыку», якая сведчыць, што аргументацыя пры апісанні алгарытму ад завяршальнага стану да пачатковага стану лягчэй ўспрымаецца, паколькі абапіраецца на ўмовы якiя ўжо склаліся бы да пачатку разгляданага кроку, у той час як магчымыя завяршэння працэсу таксама вызначаны.
У адпаведнасці з гэтым на мал. 6.13-2 аналізуюцца магчымыя пераходы ў завяршальнае мноства станаў "3" з кожнага магчымага стану ў яму папярэднім мностве станаў "2", быццам бы ўвесь папярэдні шлях ужо пройдзены і засталося апошнім выбарам аптымальнага шаговокіраўніцтва завяршыць увесь працэс. Пры гэтым для кожнага са станаў у мностве "2" вызначаюцца ўсе поўныя выйгрышы як сума = "ацэнка пераходу" + "ацэнка завяршальнага стану". У мностве "2" з атрыманых для кожнага са станаў, у ім магчымых поўных выйгрышаў, вызначаецца і запамінаецца максімальны поўны выйгрыш і адпаведны яму пераход (фрагмент траекторыі). Максімальны поўны выйгрыш для кожнага са станаў ва мностве "2" узяты ў прастакутную рамку, а адпаведны яму пераход адзначаны стрэлкай. Такіх аптымальных пераходаў з аднаго стану ў іншыя, якім адпавядае адно і тое ж значэнне поўнага выйгрышу, у прынцыпе можа апынуцца і некалькі. У гэтым выпадку ўсе яны ў метадзе неадметныя і эквівалентныя адзін іншаму ў сэнсе пабудаванага крытэрыю аптымальнасці выбару траекторыі ў прасторы параметраў, якімі апісваецца сістэма.
Пасля гэтага мноства "2", якое папярэднічала завяршальнаму працэс мноству "3", можна разглядаць у якасці завяршальнага, паколькі вядомыя ацэнкі кожнага з яго магчымых станаў (максімальныя поўныя выйгрышы) і далейшая аптымізацыя паслядоўнасці крокавых упраўленняў і выбар аптымальнай траекторыі могуць быць праведзены толькі на яшчэ не разгледжаных мноствах, якія папярэднічаюць мноству «2» у аптымізаваным працэсе (т.е. на мноствах «0» і «1»).
Такім чынам, працэдура, ілюстраваная мал.6.13-2, працаздольная на кожным алгарытмічнам кроку метаду пры пераходах з n-га ў (n — 1)-е мноства, пачынаючы з завяршальнага N-нага мноства да пачатковага стану сістэмы.
У выніку паслядоўнага попарного перабору мностваў, пры праходжанні за ўсё іх наборы, вызначаецца аптымальная паслядоўнасць пераёмнасці крокавых упраўленняў,
максімальна магчымы поўны выйгрыш і адпаведная ім траекторыя. На мал. 6.13-3(На малюнкі толькі рысачкі і лічбы - малюнак на мой погляд залішні. Вертыкальныя лініі крокі, шарезонтально-крывыя пераходы. Вось і ўсё) патоўшчанай лініяй паказана аптымальная траекторыя для прыкладу якi разглядаўся.
У разгледжаным прыкладзе крытэрый аптымальнасці - сума крокавых выйгрышаў. Але як было адзначана раней, крытэрый аптымальнасці можа быць пабудаваны і як твор абавязкова н е а д м о ў н ы х самножнікаў.
Паколькі вынік (сума або твор) не змяняецца пры змене парадку аперацый са складнікамі або самножнікамі, то алгарытм працаздольны і пры пераборы мноства магчымых станаў у парадку, зваротным разгледжанаму: т.е. ад зыходнага да завяршальнага мноству магчымых станаў.
Калі мноства магчымых станаў упарадкаваны ў храналагічнай паслядоўнасці, то гэта азначае, што разліковая схема можа быць пабудавана як з рэальнага Сапраўднага якое прагназуем пэўнай будучынсцью, так і з прагназуемай пэўнай будучыні ў рэальную сучаснасць. Гэтая акалічнасць кажа аб двух нефармальных суадносінах рэальнага жыцця, якія ляжаць па-за алгарытмам, алгебрай метаду:
I.Метад дынамічнага праграмавання фармальна, алгарытмічна неадчувальны да характара прычынна-следчых абумоўленасцяў (у прыватнасці, ён не адрознівае прычын і следства). Па гэтай прычыне кожная канкрэтная інтэрпрэтацыя метаду ў прыкладных задачах павінна будавацца на нефармальнам уліку рэальных абумоўленасцяў следстваў прычынамі.
II. Калі прагнозы ў згодзе з іерархічна найвышэйшым усёабдымнай кіраваннем, а прыватнае кіраванне, укладзенае ва усёабдымнае кіраванне, ажыццяўляецца кваліфікавана, у сілу чаго працэс прыватнага кіравання працякае ў ладу з іерархічна найвышэйшым усёабдымнЫМ кіраваннем, то не існуе кіраўнічы значнай
РОЗНІЦЫ ПАМІЖ РЭАЛЬНЫМІ Ч А С А М І і АБРАНЫМ у БУДУЧЫМ.
Працэс цэласны, па якой прычыне тое што яшчэ не адбылося, але ўжо маральна абрана і аб'ектыўна не забароненае Звыш будучынёю, якая сучасна ў гэтым абараняе тых, хто яго творыць на ўсіх узроўнях: пачынаючы ад абароны псіхікі ад наваждений да абароны ад мэтанакіраванай "фізічнай" агрэсіі. Гэта значыць, калі матрыца магчымых станаў (яна ж матрыца магчымых пераходаў) абраная ў ладу з іерархічна найвышэйшым усёабдымнай кіраваннем, то яна сама - абарона і зброя, сродак кіравання, на якое замкнёныя ўсе шэсць прыярытэтаў сродкаў абагульненага зброі і кіравання (гл. раздзел 8.5).
Аб'ектыўнае існаванне матрыц магчымых станаў і пераходаў выяўляецца ў тым, што ў слепаце можна «зайсці» с нейкія матрыцы пераходу і адчуць на сабе іх аб'ектыўныя
уласцівасці. Апошняе ацэньваецца суб'ектыўна, у залежнасці ад адносін да гэтых уласцінасцяў, як паласа выключнага шанцавання альбо як нуднае "вяртанне на кругі свая" або паласа жорсткага нешанцавання.
Але для карыстання метадам дынамічнага праграмавання і спадарожнымі яго асваенню нефармалізаванымі ў алгарытме жыццёвымі праявамі матрыц пераходу, неабходна ЗАХАВАННЕ ГАЛОўНАГА з умоў:
У задачах аптымізацыі працэсаў кіравання Метад дынамічнага праграмавання <рэальнага будучага сродкамі матрычна-эгрегориального характару: - па змаўчанні> працаздольны толькі, калі вызначаны вектар мэтаў кіравання, т.е. павінна быць абрана завяршальнае да працэсу пэўны стан.

У рэальнасці гэта завяршальна пэўны стан павін быць загадзя устойлівым і прымальным працэсам, які абдымае і апорным аптымізуемы метадам прыватны працэс.
Але выбар і вызначэнне пэўных характарыстык працэсу, у які павінна ўвайсці кіраваная сістэма па завяршэнні алгарытму метаду, ляжыць па—за гэтам метадам - у вобласці "містыкі" або у галіне метадаў, развітых у матэматычных не па свайму сутнасці навуках і рамёствах.
Гэта азначае, што прымяненне метаду дынамічнага праграмавання да практычнага вырашэння задач у жыцці (і раней усяго - да вырашэння задач матрычна-эгрэгарыяальнага кіравання сацыяльнымі і агульнапрыроднымі працэсамі) грунтуецца на інтуіцыі і мастацтве дыялектыкі, абумоўленых рэальнай маральнасцю і рэлігійнасцю індывіда (гл. цяперашняга курсу, частку 1). Прычына гэтага ў тым, што, рашэнне задачы аб гарантаванай устойлівасці і прымальнасці канчатковага стану працэсу, аптымізаванага метадам дынамічнага праграмавання, мяркуе пастаноўку і атрыманне адказаў на пытанні:
I. А для чаго неабходна дасягнуць менавіта гэтага канчатковага стану-вектара мэтаў і кожнай мэтаў з якія ўваходзяць у яго склад? - гэта значыць, дасягненне якіх мэтаў вышэйшага парадку забяспечваецца дасягненнем прыватных мэтаў у перспектыве, якія характарызуюць канчатковы стан аптымізаванага працэсу?
II. Ці ляжаць гэтыя мэты вышэйшага парадку ў рэчышчы хоць бы Промыслу?
Другое значнае аб'ектыўнае абмежаванне магчымасцяў практычнага прымянення звязана з выяўленнем пачатковага стану і вынікае з наступнага становішча: «якое б ні был стан сістэмы перад чарговым крокам, трэба выбіраць кіраванне на гэтым кроку так, каб выйгрыш на дадзеным кроку плюс аптымальны выйгрыш на ўсіх наступных кроках быў максімальным», — Е. С. Вентцель, «Даследаванне аперацый. Задачы, прынцыпы, метадалогія". (Масква, "Навука", 1988 г., с. 109).
Няздольнасць вызначыць вектар мэтаў кіравання (дасягненнем якога павінен завяршыцца аптымізаваны ў метадзе працэс) і (або) няздольнасць выявіць зыходны стан аб'екта кіравання і хоць бы адзін шлях пераходу з пачатковага стан ў завяршальные не дазваляе рушыць услед гэтай рэкамендацыі, што аб'ектыўна закрывае магчымасці да выкарыстання метаду дынамічнага праграмавання, паколькі пачатак
і канец працэсу, матрыца пераходаў павінна быць вызначаны ў прасторы параметраў, на якіх пабудавана матэматычная (ці іншая) мадэль метаду (яна павінна быць метралагічна абгрунтаван, што з'яўляецца асновай яе суаднясення з рэальнасцю). Прычым пэўнасць завяршэння аптымізаванага працэсу і прыналежнасць яго ўстойліваму прымальнаму объемлющему працэсу мае кіраўнічае большае значэнне, чым памылкі і некаторыя нявызначанасці ў ідэнтыфікацыі (выяўленні) пачатковага стану аб'екта кіравання.
Гэта тым больш справядліва для паслядоўных шматварыянтных крокавых пераходаў, калі матрыца магчымых станаў ўпісваецца ў прыказку "Усе дарогі вядуць у "Рым"", а якія не вядуць у "Рым", - вядуць у нябыт. Для такога роду працэсаў, калі абраная ўстойлівая ў часе мэта і да яе вядуць мноства траекторый, то пры ўстойлівым пакрокавым кіраванні «адлегласць»* паміж аптымальнымі траекторыямі, ідучымі да
адной і той жа мэты з розных зыходных станаў, ад кроку да кроку скарачаецца, аж да поўнага супадзення аптымальных траекторый, пачынаючы з некаторага кроку. Гэта зацвярджэнне тым больш справядліва, чым больш вызначана становішча завяршальнага працэса вектара мэтаў у прасторы параметраў. Па аналогіі з матэматыкай гэта можна назваць асімптатычным мноствам траекторый: асімптатычна мноства траекторый выяўляецца у тым, што "ўсе дарогі вядуць у "Рым"..."

* У прасторы фармальных параметраў, якія апісваюць працэс.

Іншае заўвага адносіцца ўжо да практыцы — да ўваходжання ў матрыцу пераходу. Калі пачатковая стан сістэмы вызначана з хібнасцю, большай, чым неабходная для ўваходжання ў матрыцу пераходу з рэальнага пачатковага стану у абранае канчатковае, то кіраванне на аснове самога па сабе беспамылковага алгарытму метаду дынамічнага праграмавання прывядзе да зусім іншым выніках, а не разлічаным аптымальнам стане сістэмы. Груба кажучы, не варта прымаць за выхад з памяшкання на высокім паверсе адкрытае ў ім акно.
Гэта значыць метад дынамічнага праграмавання, неабходнасцю як пэўнасці ў выбары канчатковага стану-працэсу, так і выяўлення сапраўднага пачатковага стану, сам сабой абаронены ад прымянення яго для навукападобнай імітацыі аптымізацыі кіравання пры адсутнасці такой.
Аднак галоўная карыснасць ў ДОТУ метаду дынамічнага праграмавання не ў яго магчымасцях і асаблівасцях, аб якіх было сказана вышэй. Важна звярнуць увагу і паНЯТЬ: калі ў матэматыцы бачыць навуку аб аб'ектыўнай общевселенской меры (праз «яць»), а ў яе паняційным, тэрміналагічным апараце і сімволіцы бачыць адно з прадстаўленых людзям сродкаў апісання аб'ектыўных прыватных працэсаў, што выдзяляюцца імі з некаторых працэсаў якія абдымаюць, то ўсякае апісанне метаду дынамічнага праграмавання ёсць кароткі выклад ўсёй раней выкладзенай досыць агульнай тэорыі кіравання, уключаючы і яе містыка-рэлігійныя аспекты; але - на мове матэматыкі і фармальнай логікі.
Каб патлумачыць гэта, звернемся да мал. 6.13-4 (ніжэй па тэксце), памятаючы аб зробленым раней заўвазе аб пэўнасці пачаковага стану з дастатковай для ўваходжання ў матрыцы пераходу дакладнасць.
На ім паказаны два аб'екты кіравання "А" і "Б" у пачатковым стане; тры аб'ектыўна магчымых завяршальных стану (мноства "5"); мноства ("1" - "4") прамежкавых магчымых станаў; і шляхі аб'ектыўна магчымых пераходаў з кожнага стану ў іншыя.
 Мал. 6.13-4 можна прыпадобніць некатораму фрагменту общевселенской меры развіцця (шматварыянтнасць прадвызначэння быцця) - аднаго са складнікаў у трыадзінстве матэрыя-інфармацыя-мера.
Калі прыняць такое прыпадабненне мал. 6.13-4, то аб'ектыўна магчымы пераход з любога пачатковага стану "0:1" або "0:2" у любы з завяршальных станаў «5:1», «5:2», «5:3». Але гэтая аб'ектыўная магчымасць можа быць абмежаваная суб'ектнымі якасцямі кіраўнікоў, якія маюць намер перавесці объекты "А" і "Б" з пачатковага стану ў адзін з завяршальных састаянняў.
Калі Звыш дадзена Распазнаванне, то кіраўнік «А» (ці «Б»)здыме з аб'ектыўнай меры кальку*, на якой будзе бачны хоць бы адзін з мноства магчымых шляхоў перакладу аб'екта з пачатковага стану ў мноства завяршальных. Калі распазнаванне не дадзена, згублена або адпрэчана ў пагоні за пажадлівасцю, або бяздумнай верай у якую-небудзь традыцыю, але не Богу па сумленні, то на "кальцы" будуць адсутнічаць нейкія шляхі і стану, але могуць "з'явіцца" аб'ектыўна немагчымыя шляхі і станы, аб'ектыўна не існуючыя ў праўдзівай Богам дадзенай меры - Прадвызначэнні быцця. Акрамя таго, па суб'ектыўным самавольства кіраўніка выбіраецца і жаданы пэўны завяршальны стан з іх мноства. Адпаведна прытрымліванне адсябяцін або памылка ў выбары пераважнага завяршальнага стану можа абярнуцца катастрофай з незваротнымі наступствамі.

* Калька - напаўпразрыстая папера альбо прасякнутая васковым складам тонкая тканіна — Батыст - самае простой сродак капіявання штрыхавых малюнкаў да з'яўлення ксераксаў, кампутараў і сканараў: калька накладвалася на малюнак і фіксавалася на ім. Пасля гэтага на кальцы ўручную прамалёўваецца (алоўкам, чарніламі або тушшу) капіяваны малюнак.

Але матрыца магчымых станаў, паказаная на мал. 6.13-4, магчыма прадвызначае толькі прыватны працэс у нейкай ўзаемнай ўкладзенасці працэсаў. Па гэтай прычыне кожнае з на чальных станаў «0:1», «0:2» можа належаць альбо аднаму
і таму ж, альбо розным аб'емным працэсам, у кіраўнічым сэнсе іерархічна вышэйшым па адносінах да разглядаемага; тое ж тычыцца і кожнага з завяршальных станаў
«5:1», «5:2», «5:3» у пары "зыходна-завяршальнам" стане. Кожны з аб'емных працэсаў валодае іх уласнымі характарыстыкамі і скіраванасцю плыні падзей у ім.
Можа апынуцца, што мэта "5:1" Вельмі прывабная, калі глядзець на яе з мноства пачатковых нездавальняючых станаў. Але не выключана, што аб'ёмны працэс, да якога завяршальнае стан «5:1» належыць, як прамежкавы стан, у сілу ўзаемнай ўкладзенасці працэсаў, на адным з наступных крокаў завяршаецца поўнай і незваротнай катастрофай. Напрыклад, мэта «5:1» — не спазніцца на "Тытанік", які выходзіць у свой першы рэйс ... Які стаў трагічным і апошнім. Каб не выбіраць такую мэту з мноства аб'ектыўна магчымых, неабходна быць у ладу з іерархічна найвышэйшым усёабдымном кіраваннем, якое ўтрымае прыватнае ладное кіраванне ад выбару такой мэты, якая належыць да асуджанага на знікненне працэсу.
Але калі рыс. 6.13-4 "калька" з аб'ектыўнай меры, то можа стацца, што якое-то завяршальны стан, якi з'яўляецца вектарам мэтаў — адсябеціну, якая выказвае жаданне «сесці на два цягніка адразу». Іншымі словамі, розныя кампаненты вектара мэтаў належаць да двух ці больш ўзаемна выключаных адзін аднаго іерархічна вышэйшых обдымных працэсаў якiя працякаюць адначасова.
Гэта адзін з выпадкаў нявызначанасці і дэфектыўнасці вектараў мэтаў, які робіць метад дынамічнага праграмавання непрацаздольным, а рэальны працэс "кіравання" няўстойлівым, паколькі адна і тая ж "лодка" не можа прыстаць і да правага, і да левага берага адначасова, нават калі Прывабныя прыгажосці на абодвух берагах ракі, пры поглядзе здалёк - з-за павароту ракі - сумяшчаюцца, ствараючы бачнасць падыходнага для пікніка вельмі ўтульнага месца. Каб не выбраць такой вектар мэтаў, таксама неабходна, каб было дадзена Звыш Адрозніванне правага і левага «берагоў» патоку быцця.
Гэта значыць алгарытм дынамічнага праграмавання, нават калі яго можна запусціць, спадарожнічае яшчэ адна знешняя акалічнасць, якая таксама відавочна "само сабой" зразумела, але ў большасці выпадкаў ігнаруецца: завяршальные прыватна аптымізуемы працэс стану павінны належаць объемлющему працэсу, які валодае загадзя прымальнымі ўласнымі характарыстыкамі плыні падзей у ім.
Пасля абрання мэты, якая належыць ва ўзаемнай ўкладзенасці да працэсу які ахоплівае з прымальнымі характарыстыкамі ўстойлівасці і скіраванасцю плыні падзей у ім, неабходна ўбачыць шляхі пераходу і выбраць аптымальную паслядоўнасць пераемных крокаў, якая вядзе ў абраны  прыватна працэс які завяршау стан; г.зн. неабходна абраць канцэпцыю кіравання.
Канцэпцыя кіравання ў аб'ектыўнай меры, валодае ўласнымі характарыстыкамі, якія сумесна з суб'ектыўнымі характарыстыкамі суб'екта-кіраўніка спараджаюць імавернасную наканаванасць ажыццяўлення ім канцэпцыі кіравання. Значэнне імавернаснай наканаванасці паспяховага завяршэння працэсу - аб'ектыўная іерархічна вышэйшая мера, ацэнка замкнёнай сістэмы "аб'ект + кіраўнік + канцэпцыя", у адрозненне ад верагоднасці, як гэты тэрмін разумеецца ў тэорыі верагоднасцяў, - аб'ектыўнай меры сістэмы "аб'ект + аб'ектыўна існуючая канцэпцыя кіравання".
Таму, чым ніжэй верагоднасць перакладу аб'екта ў пажаданы завяршальны стан, тым вышэй павінна быць кваліфікацыя кіраўніка, якая падвышае Значэнне імавернаснай
перадвызначанасці паспяховага завяршэння працэсу кіравання.
Адпаведна сказанага, для адміністратара прызнанне ім нейкай канцэпцыі кіравання можа выяўляцца ў яго сыходзе з пасады па ўласнай ініцыятыве, якая вынікае з усведамлення ім сваёй няздольнасці да ажыццяўлення прызнанай ім канцэпцыі кіравання; а непрыманне канцэпцыі можа выяўляцца, як заяву аб яе прыняцці і наступныя шчырыя дбайныя, але некваліфікаваныя намаганні па яе ажыццяўленню. Яны прывядуць да таго, што канцэпцыя будзе дыскрэдытавана, паколькі кваліфікаваныя кіраўнікі, здольныя да яе ажыццяўленню, не будуць дапушчаныя да кіравання па асабістай рэўнасці, смазе славы, зарплаты ці яшчэ чагосьці з боку добранамерана саманадзейнага некваліфікаванага недачалавека.
З прычыны нетоеснасці верагоднасці (матэматычнай) і імавернаснай наканаванасці (жыццёвай з'явы) вельмі добрая канцэпцыя можа быць загублена дрэннымі выканаўцамі яе: на двухколавым ровары ездзіць лепш, чым на трохколавым, але не ўсе ўмеюць; але некаторыя яшчэ будуць даказы ваць, што на двухколавым і ездзіць-то нельга, паколькі ён заўсёды падае і сам па сабе, а не тое што з чалавекам якія сядзяць на ім, тым больш на хаду, - калі яны раней не бачылі, як ездзяць на двухколавым; а
трэція, не ўмеючы і не жадаючы вучыцца ездзіць самім, з рэўнасці ня аддадуць ровар тым, хто ўмее.
Таму пасля прыняцця канцэпцыі да выканання неабходна прытрымлівацца канцэптуальнай самадысцыпліны самому і ўзгадоўваць канцэптуальную самадысцыпліну ў навакольным грамадстве. Гэта значыць неабходна падтрымліваць досыць высокую якасць кіравання на кожным кроку усімі сродкамі, каб не апынуцца да пачатку наступнага кроку ў становішчы, з якога ў адпаведнасці з абранай канцэпцыяй кіравання пераклад аб'екта ў абранае завяршальнае стан немагчымы. Гэты выпадак
- ухіленне з абранага шляху «2:2» , «3:3» паказаны: дуга «2:2», "3:1" - незваротны зрыў кіравання, пасля якога немагчымы пераход у стан "5:3"; дуга «2:2», «3:2» — зварачальны зрыў кіравання, у тым сэнсе што патрабуецца карэктаванне канцэпцыі, зыходзячы з стану "3:2", разгляданага ў якасці пачатковага.
Калі на мал. 6.13-4 аб'ектыўнай іерархічна вышэйшай меры якасці станаў, у якіх могуць знаходзіцца аб'екты суб'ектаў-кіраўнікоў «А» і «Б», адпавядае шкала якасці магчымых станаў «I», то для іх выгоды мэтазгодны пераход з мноства станаў «0» у стан «5:3». Але выбар імі накіраванасці шкалы ацэнкі якасці станаў маральна абумоўлены і суб'ектыўны: альбо як паказана на мал. 6.13-4 "I", альбо ў процілеглым "I" кірунку.
Калі на мал. 6.13-4 магчымыя стану згрупаваныя ва мноства «1», «2», «3», «4», «5» па прыкмеце сінхроннасці, то ў каардынатных восях 0ty, пры шкале якасці станаў "I" Адлегласць ад восі 0t да любой з траекторый - бягучая памылка кіравання пры руху па гэтай траекторыі. Плошча паміж воссю і 0t траекторыяй-інтэграл па часе ад бягучай памылкі. Ён можа быць выкарыстаны як крытэрый-мінімум аптымальнасці працэсу кіравання ў цэлым, т. е. у якасці поўнага выйгрышу, які з'яўляецца ў метадзе дынамічнага праграмавання мерай якасці, але не магчымых станаў, не крокаў-пераходаў з аднаго стану ў іншае, а ўсёй траекторыі пераходу. Але ў агульным выпадку метаду крокавыэ выйгрыша могуць быць пабудаваны і інакш.
Калі прыняты крытэрый аптымальнасці тыпу мінімум* значэнні інтэграла па часе ад бягучай памылкі кіравання (на мал. 6.13-4 гэта - плошча паміж воссю 0t і траекторыяй пераходу), то для суб'екта "А " аптымальная траекторыя — «0:2» - «1:3» - «2:2» - «3:3» - «4:4» - «5:3»; А для суб'екта «Б» аптымальная траекторыя — «0:1» - «1:2» - «2:2» - «3:3» - «4:4» - «5:3».
Зрывы кіравання «1:2» - «2:1» - «3:1»; «2:2» - «3:1»; «2:2» - «3:2» - «4:1»; «3:2» - «4:2» — поўная незваротная катастрофа кіравання па канцэпцыі, аб'ектыўна магчымай, але не ажыццёўленай па прычыне нізкай якасці бягучага кіравання ў працэсе перакладу аб'екта ў выбраны канчатковы стан «5:3». Усе астатнія зрывы кіравання зварачальныя ў тым сэнсе, што патрабуюць карэкцыі канцэпцыі і кіравання па меры іх выяўлення.
Гэта значыць метад дынамічнага праграмавання ў схеме кіравання "прэдыктар-карэктар" працаздольны, а сама схема разгортваецца, як яго практычная рэалізацыя.
Магчымыя інтэрпрэтацыі метаду, калі ў вектар кантрольныхпараметраў (ён з'яўляецца падмноствам вектара стану) не ўваходзяць нейкія характарыстыкі аб'екта, якія тым не менш, ўключаны ў крытэр выбару аптымальнай траекторыі. Напрыклад, калі ў стане "0:2" розныя суб'екты не адрозныя па іх зыходных энергарэсурсах, а крытэрый выбару аптымальнай траекторыі адчувальны да энергазатратах на пераходах, то такому крытэрыю можа адпавядаць у якасці аптымальнай траекторыя «0:2» - «1:2» - «2:1» - «3:2» - «4:3» - «5:3» ці нейкая іншая, але не траекторыя «0:2» - «1:3» - «2:2» - «3:3» - «4:4» - «5:3», на якой дасягаецца мінімум інтэграла ад бягучай памылкі кіравання.

* Хоць у кананічным выглядзе метаду прысутнічае крытэр - максімум, але выкарыстанне крытэра - мінімум таксама магчыма, паколькі ў практыцы пераход да кананічнай форме задачы дасягаецца памнажэннем на "мінус адзінку" адпаведных значэнняў і выразаў.

Гэта азначае, што кіраўнік, у распараджэнні якога дастатковы энергаспажыванне, можа абраць траекторыю «0:2» - «1:3» - «2:2» - «3:3» - «4:4» - «5:3»; але калі кіраўнік з недастатковым для такога пераходу энергаспажываннем не бачыць траекторыі «0:2» - «1:2» - «2:1» - «3:2» - «4:3» - «5:3», для праходжання якой яго энергаспажыванне дастатковы, то стан "0: 2" для яго суб'ектыўна тупіковы, бязвыхадны, хоць аб'ектыўна такім не з'яўляецца. Гэта кажа аб першынстве Адрознівання, якое даецца Звыш непасрэдна кожнаму, перад усім іншымі здольнасцямі, навыкамі і ведамі.
Акрамя таго, гэты прыклад паказвае, што на адной і той жа "кальцы" з матрыцы магчымых станаў, суадноснай з паўнатой рэальнасці, можна пабудаваць набор крытэрыяў аптымальнасці, кожны з прыватных крытэрыяў у якім ўжываецца ў залежнасці ад канкрэтных абставінаў ажыццяўлення кіравання. І кожнай кампаненце гэтага набору адпавядае і свая аптымальная траекторыя. Кампаненты гэтага набору крытэрыяў, гэтак жа як і кампаненты ў вектары мэтаў, могуць быць упарадкаваны па пераважнасці варыянтаў аптымальных траекторый. Але ў адрозненне ад вектара мэтаў, калі пры ідэальным кіраванні рэалізуюцца ўсе без выключэння мэты якія ўваходзяць у яго, нягледзячы на іерархічную ўпарадкаванасць крытэрыяў аптымальнасці, адзін
аб'ект можа пераходзіць з стану ў стан толькі па адзінай траекторыі з усяго мноства аптымальных, у сэнс кожнага з крытэраў у наборы, траекторый. Крытэрыі аптымальнасці выбару, якія ўваходзяць у іерархічна арганізаваны набор крытэрыяў, не абавязкова могуць быць задаволены ўсе адначасова. Для кіравання неабходна, каб працэс адказваў хоць бы аднаму з мноства дапушчальных крытэраў.
Можа скласціся так, што адзін суб'ект рэалізуе канцэпцыю «0:2» - «1:2» - «2:1» - «3:2» - «4:3» - «5:3», а другі «0:2» - «1:3» - «2:2» - «3:3» - «4:4» - «5:3» у дачыненні да аднаго і таго ж аб'екта. Хоць канчатковыя мэты супадаюць, але тым не менш, калі кіраўнікі належаць да мноства кіраўнікоў аднаго і таго ж ўзроўню ў іерархіі ўзаемнай ўкладзенасці працэсаў, то гэта - канкурэнцыя, "спартыўная" гонка або канцэптуальная вайна; калі яны належаць да розных іерархічнага узроўня у адной і той жа сістэме, то гэта-антаганізм паміж яе іерархічнымі ўзроўнямі, які вядзе як мінімум да падзення якасці кіравання ў сэнсе, прынятым на яе іерархічна найвышэйшым узроўні, а як максімум - да распаду сістэмы. Тым больш, калі завяршальныя мэты розныя, то гэта - канцэптуальная вайна, абвастраецца па ходзе працэсу. У такога роду канфліктах арбітр - іерархічна вышэйшае ў адносінах да іх абодвух кіраванне якое ахоплівае - аж да іерархічна найвышэйшага кіравання -Усеўлады.
З сказанага варта, што алгарытм дынамічнага праграмавання і рыс. 6.13-4, які ілюструе некаторыя аспекты яго прыкладанняў, з'яўляецца даволі празрыстым намёкам на вельмі сур'ёзныя жыццёвыя абставіны.
У цэлым жа метад дынамічнага праграмавання ў яго абстрактнай пастаноўцы (т.е. не прывязанай да якой-небудзь практычнай задачы) дазваляе сфармаваць сістэму вобразна-лагічных уяўленняў аб працэсах кіравання наогул, і ўпісваць у гэтую схему ўсе практычныя жыццёвыя кіраўніцкія патрэбы як адной асобы, так і грамадства. Гэта неабходна для ўсвядомленага ўваходжання ў кіраванне нават у
тым выпадку, калі кіраванне рэальна будуецца на аснове нейкіх іншых мадэляў.

Уласна па гэтай прычыне метад дынамічнага праграмавання уключаны ў курс ДОТУ і звязаны ў ёй з праблематыкай, якая адносіцца да кампетэнцыі філасофіі як свайго роду «камертона» для налады светапогляду і светаразумення, што прадвызначае выніковасць усякай дзейнасці.


Рецензии