Gry różniczkowe

Gry różniczkowe – dział matematycznej teorii sterowania optymalnego, w którym rozpatruje się sterowanie w sytuacjach konfliktowych. Ma on także związek z teorią gier. Teoria powstała w latach 50. XX wieku.

Sformułowania problemów teorii gier różniczkowych

W teorii wyróżnia się dwa rodzaje gier:

gra dwóch graczy,
gra wielu graczy.

Podstawowe wyniki uzyskano dla gier różniczkowych dwóch graczy, a sama gra podporządkowana jest wtedy następującemu schematowi:

dany jest pewien układ dynamiczny, w którym część sterujących działań podporządkowana jest graczowi I, a inna część graczowi II,
zakłada się, że dla każdego z graczy wybór działań gwarantujących mu osiągnięcie założonego celu, przy dowolnym, nieznanym wcześniej sterowaniu przeciwnika, opiera się jedynie na informacji o bieżącym stanie układu^[1].

W teorii gier różniczkowych rozpatruje się także problemy, w których zakłócenia działania układu traktuje się jako działania przeciwnika.

Zazwyczaj zakłada się, że ruch sterowanego układu jest podporządkowany równaniu różniczkowemu

{\dot {x}}=f(t,x,u,v)

gdzie $x$ jest wektorem fazowym układu, $u$ i $v$ – wektorami sterowania odpowiednio graczy I i II, a $t$ czasem. Określona jest klasa strategii ${\mathcal {U}}$ gracza I, a dla każdej strategii $U\in {\mathcal {U}}$ określony jest wiązką ruchów $X(U),$ która jest generowana przez tę strategię oraz wszystkie możliwe strategie przeciwnika. Wiązka ta wychodzi z początkowego stanu powyższego układu.

Na ruchach $x(t),t\geqslant t_{0}$ układu zadany jest funkcjonał $\gamma (x(\cdot ))$ nazywany płacą gry, którego wartość gracz I stara się zminimalizować. Czasem funkcjonał $\gamma$ zależy także od realizacji $u(t),v(t),t\geqslant t_{0}$ sterowania obu graczy^[2].

Biorąc pod uwagę także najbardziej niekorzystną realizację ruchu $x(\cdot )\in X(U),$ gdy wybór strategii jest pozostawiony graczowi II, jakość strategii $U\in {\mathcal {U}}$ jest oceniana za pomocą wielkości:

\kappa _{1}(U)=\sup\{\gamma (x(\cdot )):x(\cdot )\in X(U)\}.

Zadanie gracza I polega na określeniu strategii $U_{0}\in {\mathcal {U}},$ na której realizowane jest minimum funkcjonału $\kappa _{1}$ (jest to zadanie potęgi). Czasem rozpatruje się zadanie jakości, które polega na znalezieniu strategii $U_{c}\in {\mathcal {U}}$ spełniającej nierówność:

\kappa _{1}(U_{c})\leqslant c,

gdzie $c$ jest daną liczbą^[3].

W analogiczny sposób można sformułować zadanie gracza II. Jego strategia $V\in {\mathcal {V}}$ jest oceniana przez wielkość:

\kappa _{2}(V)=\sup\{\gamma (x(\cdot )):x(\cdot )\in X(V)\}.

Zadanie potęgi polega wtedy na znalezieniu strategii maksymalizującej wartość funkcjonału $\kappa _{2},$ a zadanie jakości – na znalezieniu strategii $V_{c}\in {\mathcal {V}},$ dla której:

\kappa _{2}(V_{c})\geqslant c.

Jeśli w zadaniach graczy I i II klasy strategii ${\mathcal {U}}$ i ${\mathcal {V}}$ mają taką własność, że dla każdej pary uporządkowanej $(U,V)\in {\mathcal {U}}\times {\mathcal {V}}$ można określić choć jeden ruch

x(\cdot )\in X(U)\cap X(V),

generowany przez tę parę, to oba te zadania generują grę różniczkową na klasie strategii ${\mathcal {U}}\times {\mathcal {V}}.$

Jeśli w grze różniczkowej spełniona jest równość

\inf _{U\in {\mathcal {U}}}\,\,\sup _{x(\cdot )\in X(U)}\gamma (x(\cdot ))=\sup _{V\in {\mathcal {V}}}\,\,\inf _{x(\cdot )\in X(V)}\gamma (x(\cdot ))=c_{0},

to wielkość $c_{0}$ nazywa się ceną gry różniczkowej^[3].

Przykład

Typowym przykładem gry różniczkowej jest zagadnienie pościgu-ucieczki^[4]. W tej grze

x=(x_{1},\dots ,x_{k+l})=(y_{1},\dots ,y_{k},z_{1},\dots ,z_{l}),

gdzie $y=(y_{1},\dots ,y_{k}),z=(z_{1},\dots ,z_{l})$ są odpowiednio wektorami fazowymi ścigającego i uciekającego, a ich ruch opisywany jest równaniami

{\dot {y}}=g(t,y,u),{\dot {z}}=h(t,z,v)

^[3].

Najczęściej rozpatruje się przypadki, gdy wybór sterowania podlega ograniczeniom typu

u\in P,v\in Q,

gdzie $P,Q$ są pewnymi zbiorami zwartymi. Płacą w takiej grze jest czas spotkania, tzn.:

\gamma (x(\cdot ))=T(x(\cdot ))=\inf\{t-t_{0}:||\{y(t)\}_{m}-\{z(t)\}_{m}\|\leqslant \varepsilon \},

gdzie $\{y(t)\}_{m}$ i $\{z(t)\}_{m}$ są wektorami utworzonymi z pierwszych $m$ współrzędnych wektorów $y$ i $z.$ Zatem zbliżenie punktów $\{y(t)\}_{m}$ i $\{z(t)\}_{m}$ na odległość mniejszą od $\varepsilon$ jest interpretowane jako spotkanie obiektów.

Przypisy

↑ И.М. Виноградов (redaktor): Математическая Энциклопедия. T. 2. Д-Коо. Москва: Советская Энциклопедия, 1979, s. 329. (ros.).
↑ Математическая Энциклопедия, op. cit., s. 329.
↑ ^a ^b ^c Математическая Энциклопедия, op. cit., s. 330.
↑ Elementarny przykład rozwiązania takiego problemu można znaleźć w książce: Wiktor Gutenmacher, Nikołaj Wasiliew: Proste i krzywe. Warszawa: WSiP, 1995, s. 67–70. ISBN 83-02-05275-2.

Linki zewnętrzne

Gra szofer – morderca i jej modyfikacje (jęz. rosyjski),

[1] И.М. Виноградов (redaktor): Математическая Энциклопедия. T. 2. Д-Коо. Москва: Советская Энциклопедия, 1979, s. 329. (ros.).

[2] Математическая Энциклопедия, op. cit., s. 329.

[ReferenceA-3] Математическая Энциклопедия, op. cit., s. 330.

[4] Elementarny przykład rozwiązania takiego problemu można znaleźć w książce: Wiktor Gutenmacher, Nikołaj Wasiliew: Proste i krzywe. Warszawa: WSiP, 1995, s. 67–70. ISBN 83-02-05275-2.

[1]

[2]

[3]

[4]

Klasy układów	Układy statyczne Układy dynamiczne Układy liniowe Układy nieliniowe Układy stacjonarne Układy niestacjonarne Układy deterministyczne Układy stochastyczne Układy o parametrach skupionych Układy o parametrach rozłożonych Układy ciągłe Układy dyskretne
Wybrane typy regulacji	Regulacja stałowartościowa Regulacja nadążna Regulacja optymalna Regulacja adaptacyjna
Metody klasyczne	Opis typu wejście-wyjście Stabilność Transmitancja Charakterystyki czasowe Regulacja PID Charakterystyki częstotliwościowe Linie pierwiastkowe Korekcja fazy
Nowoczesna teoria sterowania	Równania stanu Stan układu Sterowalność Przesuwanie biegunów Regulator liniowo-kwadratowy Obserwowalność Obserwator stanu Filtr Kalmana Regulator LQG Sterowanie predykcyjne Krzepkość H-nieskończoność
Inne zagadnienia	identyfikacja systemów
Dziedziny powiązane	Teoria układów dynamicznych Przetwarzanie sygnałów Sztuczna inteligencja Teoria decyzji Metody numeryczne
Perspektywa historyczna	Historia automatyki

Navigation

Nawigacja

Portale tematyczne

Gry różniczkowe

Spis treści

Sformułowania problemów teorii gier różniczkowych

Przykład

Przypisy

Linki zewnętrzne

Media użyte na tej stronie