Робастное управление динамическими объектами

2. Сигналы и системы

2.1. Обозначения

Поле вещественных (комплексных) чисел обозначается как ().

Действительное (комплексное) Евклидово пространство размерностью n имеет обозначение n(n), а пространство действительных (комплексных) матриц – n×m(n×m).

Действительная часть, мнимая часть, модуль и комплексно-сопряженное комплексного числа z соответственно обозначаются как Rez, Imz, z, z¯.

Открытая правая (левая) полуплоскость комплексной плоскости имеет обозначение +=z:Re(z)>0 (-=z:Re(z)<0).

Для замкнутых полуплоскостей используются обозначения ¯+ ¯-.

Действительная переменная t обозначает время, а комплексная переменная в области преобразования Лапласа обозначается как s = α + jω, где ω является круговой частотой (в радианах в единицу времени).

A обозначает комплексно-сопряженное транспонирование (эрмитово сопряжение) комплексной матрицы A, det(A) является детерминантом матрицы A, adj(A) – присоединенная матрица, состоящая из алгебраических дополнений матрицы А и транспонированная.

Обозначение diag(A1, A2, ... , Ak) используется для блок-диагональных матриц и I=diag(1, 1, … , 1) есть единичная матрица.

Под спектром матрицы An×n понимается множество Λ(A)=i(A) C, i=1,2,…,n}, в котором λi(A) является i-м собственным значением.

2.2. Векторы и матрицы

Теорема [1, 6]. Любую матрицу An×n можно представить в виде сингулярного разложения

A=U Σ000 V ',

где Σ=diag(σ1, σ2, ..., σr), σ¯=σ1σ2σr=σ>0, rminn,m, σi (A)=λi(AA')1/2, матрицы U, V являются унитарными, т. е. UU'=I и VV'=I.

Векторные пространства n и n являются конечномерными Гильбертовыми пространствами [25] с внутренним (скалярным) произведением <x,y>=x'y, и тогда индуцированная норма (Евклидова норма) вектора xn определяется как x2 =<x'x>1/2.

Евклидова норма матрицы An×m определяется в виде A2=maxx2=1Ax2, при этом A2=σ¯A [1] .

2.3. Сигналы

Во временной области сигнал f(t) задается как измеримая функция [25], отображающая n [6].

Множество сигналов, являющихся интегрируемыми по Лебегу и ограниченных с квадратом функциями

(1) f2=-+f'tftdt1/2<,

образуют пространство Лебега L2-,+.

Это пространство является пространством Гильберта c внутренним произведением

(2) <f,g>=-+f'(t)f(t)dt,

где (1) есть 2-норма, индуцированная скалярным произведением (2).

Часто в приложениях величина f(t)22 пропорциональна мощности сигнала, поэтому L2-,+ – пространство сигналов ограниченной энергии.

Подпространство L2[0,) L2(-,+) состоит из сигналов, которые равны нулю при t < 0.

В частотной области сигнал f(jω) задается как измеримая функция: ωn. Ее 2-норма

f2=[12π-+f'(gω)f(gw)dt]1/2<,

и L2 представляет собой пространство Лебега, состоящее из всех сигналов f(jω)с конечной 2-нормой.

Это пространство Гильберта со скалярным произведением

<f,g>=12π-+f'(jω)g(jω)dω.

Последнее вводимое пространство, описывающее сигналы с конечной энергией, является пространство1 Н2: оно определяется как пространство функций комплексного переменного f(s), которые являются аналитическими в + и имеют ограниченную норму

f2=supα>0 -+f'(α+jω)f(α+jω)dt1/2<.

Для того, чтобы связать сигналы, заданные во временной и частотных областях, определим операторы Фурье и Лапласа.

Преобразование Фурье является Гильбертовым изоморфизмом между пространствами L2-,+ и L2, сохраняет внутреннее произведение и 2-норму2.

Для функции fL2(-,+) преобразование Фурье задается так

(3) F[f(t)]=limt-TTf(t)e-jωtdt.

Здесь lim означает сходимость по норме L2. Существует тождество Парсеваля [6, 17]

<f, j>=<F(f),F(g)>,

следствием которого является сохранение нормы f2=F[f]2.

Это говорит о том, что «энергия» сигнала во временной области не изменяется при применении преобразования Фурье.

Преобразование Лапласа для fL2(-,+) определяется как

(4) L[f(t)]=-+f(t)e-stdt.

Теорема Пали-Винера доказывает, что пространство H2 изоморфно пространству L2[0,∞) при применении преобразования Лапласа [6]. Поэтому в дальнейшем не будет делаться различия между величинами во временной области и их изображениями, полученными посредством преобразований Фурье или Лапласа в частотной области. Из контекста должно быть ясно, в какой области представляются сигналы или системы.

2.4. Линейные системы

Под системой понимается преобразование G из одного пространства сигналов, входного пространства Si, в другое пространство сигналов, выходное пространство So [6]

G: SiS0,

т.е.

wz=Gw, wSi, zS0.

Линейные системы образуют линейное пространство относительно сложения (параллельное соединение) и умножения на скаляр:

(G1+G2)w=G1w+G2w,

(αG)w=α(Gw).

Любая линейная система может быть представлена интегральным оператором вида

z(t)=-+G(t,τ)w(τ)dτ.

Система является каузальной (от англ. causal: причинный), когда G(t,τ)=0 для всех τ > t и инвариантна во времени (стационарна), если G(t,τ)=G(t-τ,0) для всех t,τ.

Таким образом, линейная стационарная система может быть представлена интегралом свертки

z(t)=-+G(t-τ)w(τ)dτ.

Матричная функция G(t) является матричной импульсной характеристикой – матрицей, элемент (i,k) которой есть функция gik(t) – отклик i-го выхода системы в момент времени t на Δ-функцию, поданную на k–й вход в момент t=0 [14].

Применяя к G(t) преобразование Лапласа, можно получить связь входного и выходного сигналов системы в области комплексного переменного

z(s) = G(s)w(s),

где

G(s)=-G(t)e-stdt.

Функция G(s) известна как матричная передаточная функция системы [27].

Предположим, что матричная передаточная функция G(s) является аналитической в + и удовлетворяет условию:

(5) Gs=sub Re(s)>0σ¯[G(s)]=sub α>0subω σ¯[G(α+iω)]=sub ωσ¯[G(iω)]<. 

Здесь применена теорема о максимуме модуля функции комплексного переменного, обобщенная на матричные передаточные функции с использованием понятия максимального сингулярного числа. Тогда вводится пространство Харди H, состоящее из множества передаточных функций G(s) с H-нормой (5), которая представляет собой частотный пик максимального сингулярного числа матричной передаточной функции на множестве действительных чисел ω.

Это – пространство Банаха [25, 26], и если G H, то G: H2 H2, а норма (5) совпадает с индуцированной нормой

G=subu2=1Cu2.

Пространство RH комплексно-значных правильных матричных передаточных функций, все элементы которых – вещественные дробно-рациональные реализуемые функции с устойчивыми знаменателями, является подпространством в Н: RH H.

Во временной области система G описывается уравнениями в пространстве состояний

(6)  x.=Ax+Bu, x(t0)=x0,y=Cx+Du.

Здесь x n называется вектором состояния, x(t0) – начальным состоянием системы, um – входом системы, yp – выходом системы. Матрицы A, B, C и D имеют соответствующую размерность и являются матрицами с постоянными коэффициентами.

Интегрирование системы (6) приводит к следующему решению при t0=0

(7) x(t)=eAtx0+0teA(t-τ)Bu(τ),y(t)=CeAtx0+0tCeA(t-τ)Bu(τ)+Du(τ),

где матричная экспонента имеет вид сходящегося ряда

eAt =I+k=1(At)kk!

Система асимптотически устойчива, если собственные значения матрицы λi(A)-, i=1,2,...,n.

Система (или пара (A,B)) управляема, если для любых состояний (x0, x1) и любых моментов времени (t0, t1) при t0 < t1 существует входное воздействие u(t), переводящее систему из состояния x0 в состояние x1 в момент t1. Система (или пара (A,B)) стабилизируема, если каждая неустойчивая мода управляема.

Система (или пара (A,C)) наблюдаема, если для любого момента времени t1>t0 начальное состояние x(t0)=x0 может быть определено по временной истории входа u(t) и выхода y(t) на интервале времени [t0,t1]. Система (или пара (A,C)) детектируема, если каждая неустойчивая мода наблюдаема.

Критерий управляемости: ранг матрицы управляемости

U=[B AB ... An-1B]

равен n.

Критерий наблюдаемости: ранг матрицы наблюдаемости

V=CCACAn-1

равен n.

Набор матриц (A,B,C,D) называется реализацией передаточной функции G в пространстве состояний, а размер матрицы A является порядком реализации. При этом используется запись

G(s)=ABCD

Говорят, что реализация (A,B,C,D) системы G(s) является минимальной реализацией, если матрица A имеет наименьшую размерность, т. е. система имеет наименьшее число состояний. Эта наименьшая размерность называется степенью МакМиллана. Мода является скрытой, если она неуправляема или ненаблюдаема, и поэтому не проявляется в минимальной реализации.

Т.к. только управляемые и наблюдаемые состояния вносят вклад во входо-выходное поведение системы, то реализация является минимальной, если и только если пара (A,B) управляема, а пара (A,C) наблюдаема. Система с нестабилизируемыми или недетектируемыми модами называется системой, содержащей скрытые неустойчивые моды. На практике целесообразно избегать таких систем.

В области преобразования Лапласа уравнения (6) принимают вид

x(s)=(sI-A)-1x0+(sI-A)-1Bu(s),y(s)=C(sI-A)-1x0+[C(sI-A)-1B+D]u(s),

а комплексная матричная передаточная функция системы по входному воздействию имеет выражение

(8) G(s)=C(Si-A)-1B+D=Cadj(Si-A)Bdet(sI-A)+D=ABCD,

Из (8) следует, что limsG(s)=D, и если матрица D ≠ 0, то передаточная функция G(s) называется правильной, если D = 0 – строго правильной.

Полюса системы совпадают с собственными значениями матрицы A и определяются из характеристического уравнения

det(Si-A)=i=1nλi(sI-A)=i=1n(s-λi(A))=0.

Для матричных передаточных функций помимо понятия полюсов существует понятие многомерных нулей в отличие от нулей скалярных компонент матричных передаточных функций [13]. Такие нули системы появляются, когда выход равен нулю даже когда входы (и состояния) не равны нулю. Для скалярных систем с одним входом и одним выходом нулями zi являются решения уравнения G(zi) = 0. В общем случае нулями являются величины s, при которых передаточная матрица G(s) теряет ранг. Для скалярных систем ранг изменяется от 1 до 0.

Определение. Величина zi является нулем G(s), если ранг G(zi) меньше, чем нормальный ранг G(s).

Полином для нулей определяется как

z(s)=i=1nz(s-zi),

где nz число конечных нулей G(s).

Нормальный ранг G(s) определяется как ранг G(s) при всех величинах s за исключением конечного числа особых точек, которые являются нулями.

Это определение нулей основано на матричной передаточной функции, соответствующей минимальной реализации системы. Обычно нули вычисляются из описания системы в пространстве состояний. Уравнения в пространстве состояний системы могут быть записаны в виде

P(s)zu=0y, P(s)=Si-ABCD.

Нули являются величинами s=z, для которых полиномиальная матрица системы P(s) теряет ранг, что приводит к нулевому выходу для некоторого ненулевого входа.

Численно нули находятся как нетривиальные решения при uz ≠ 0 и xz ≠ 0 в следующей задаче:

(zIg-M)xzuz=0, M=ABCD, Ig=I000.

Эта система решается как обобщенная задача на собственные значения. В стандартной задаче на собственные значения Ig = I. Обычно получаются дополнительные нули, если реализация не является минимальной.

Передаточная функция G(s) не изменяется при невырожденном преобразовании координат в изображениях по Лапласу в пространстве состояний.

Действительно, пусть x¯=T-1x, тогда матрицы системы в новом базисе будут иметь вид A¯=T-1AT, B¯=T-1B, C¯=CT, D¯=D что даст

C¯sI-A¯B¯+D¯=CT(sT-1T-T-1AT)-1T-1B+D=Gs.

Поэтому реализация любой передаточной матрицы не единственна относительно любого невырожденного преобразования, включая и минимальную реализацию.

В [28] показывается, что всегда существует невырожденное преобразование координат, xK=TK-1x, detT0, которое приводит к реализации вида

AK|BK-+-CK|DK=AK,110AK,130|BK,1AK,21AK,22AK,23AK,24|BK,200AK,330|000AK,43AK,44|0----+-CK,10CK,30|DK

Она называется канонической формой Калмана системы G. В данном базисе система декомпозируется на четыре подсистемы:

Управляемая и наблюдаемая система (AK,11, BK,1, CK,1, DK);

Управляемая, но не наблюдаемая система (AK,22, BK,2, 0, DK)

Неуправляемая, но наблюдаемая система (AK,33, 0, CK,3, DK);

Неуправляемая и ненаблюдаемая система (AK,44, 0, 0, DK).

Если присутствует только один блок AK,11, то реализация системы является минимальной. Размерность матрицы AK,11 есть степень МакМиллана передаточной функции G.


1 Вводимые пространства Н2 и Н называются пространствами Харди по имени математика G.H. Hardy.

2 Термин изоморфизм происходит от греческого словосочетания «подобная форма». Два пространства Гильберта являются изоморфными, если имеется взаимнооднозначное линейной преобразование одного пространства в другое, сохраняющее внутреннее произведение [26]. Изоморфные пространства можно рассматривать как различные реализации одного и того же пространства [26].