Luận án Nghiên cứu xây dựng thuật toán điều khiển dự báo theo mô hình cho đối tượng phi tuyến liên tục

Luận án Nghiên cứu xây dựng thuật toán điều khiển dự báo theo mô hình cho đối tượng phi tuyến liên tục trang 1

Trang 1

Luận án Nghiên cứu xây dựng thuật toán điều khiển dự báo theo mô hình cho đối tượng phi tuyến liên tục trang 2

Trang 2

Luận án Nghiên cứu xây dựng thuật toán điều khiển dự báo theo mô hình cho đối tượng phi tuyến liên tục trang 3

Trang 3

Luận án Nghiên cứu xây dựng thuật toán điều khiển dự báo theo mô hình cho đối tượng phi tuyến liên tục trang 4

Trang 4

Luận án Nghiên cứu xây dựng thuật toán điều khiển dự báo theo mô hình cho đối tượng phi tuyến liên tục trang 5

Trang 5

Luận án Nghiên cứu xây dựng thuật toán điều khiển dự báo theo mô hình cho đối tượng phi tuyến liên tục trang 6

Trang 6

Luận án Nghiên cứu xây dựng thuật toán điều khiển dự báo theo mô hình cho đối tượng phi tuyến liên tục trang 7

Trang 7

Luận án Nghiên cứu xây dựng thuật toán điều khiển dự báo theo mô hình cho đối tượng phi tuyến liên tục trang 8

Trang 8

Luận án Nghiên cứu xây dựng thuật toán điều khiển dự báo theo mô hình cho đối tượng phi tuyến liên tục trang 9

Trang 9

Luận án Nghiên cứu xây dựng thuật toán điều khiển dự báo theo mô hình cho đối tượng phi tuyến liên tục trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 151 trang nguyenduy 26/07/2024 950
Bạn đang xem 10 trang mẫu của tài liệu "Luận án Nghiên cứu xây dựng thuật toán điều khiển dự báo theo mô hình cho đối tượng phi tuyến liên tục", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

Tóm tắt nội dung tài liệu: Luận án Nghiên cứu xây dựng thuật toán điều khiển dự báo theo mô hình cho đối tượng phi tuyến liên tục

Luận án Nghiên cứu xây dựng thuật toán điều khiển dự báo theo mô hình cho đối tượng phi tuyến liên tục
c và U là tập hở (hoặc trùng với tồn bộ khơng gian điều 
khiển, tức là bài tốn khơng bị ràng buộc) thì phương pháp thích hợp nhất là 
phương pháp biến phân. Hơn thế nữa, trong trường hợp điểm trạng thái cuối 
45 
T
x là bất kỳ thì nghiệm tìm được theo phương pháp biến phân sẽ cĩ dạng phụ 
thuộc trạng thái *( ), 0 ≤ ≤t Tu x , hay nĩ cũng chính là một bộ điều khiển 
phản hồi trạng thái tối ưu. Bởi vậy, để phân biệt với nghiệm tối ưu phụ thuộc 
thời gian *( )tu , ở trường hợp này người ta thường gọi *( )u x là nghiệm tối ưu 
on-line (trực tuyến). 
3.1.1. Nguyên lý biến phân 
Nguyên lý biến phân được phát biểu như sau [5]: Nếu *u là nghiệm bài 
tốn tối ưu cĩ 0x cho trước, T cũng cho trước và U là tập hở, thì nghiệm đĩ 
phải thỏa mãn: 
*
∂
=
∂
0TH
uu
 (3.4) 
(đạo hàm tại điểm tối ưu) trong đĩ: 
− ∂ ∂u là ký hiệu đạo hàm Jacobi của một hàm nhiều biến. 
− (0, ,0)=0 KT 
− ( , ) ( , )= −TH p f x u g x u , cĩ tên là hàm Hamilton, với p là vector biến 
đồng trạng thái (costates), thỏa mãn quan hệ Euler - Lagrange: 
∂ 
= − ∂ 
&
T
H
p
x
 (3.5) 
và điều kiện biên ( ) = 0Tp khi điểm trạng thái cuối là bất kỳ. 
Dựa vào nguyên lý biến phân trên, nghiệm *u của bài tốn tối ưu liên 
tục sẽ được xác định qua các bước như sau [5]: 
1. Từ điều kiện (3.4) xác định quan hệ phải cĩ ( , )u x p cho tín hiệu điều 
khiển tối ưu. 
2. Thay quan hệ tìm được này vào hệ đã cho ( , )=&x f x u và phương trình 
Euler-Lagrange (3.5) sẽ được hệ phương trình vi phân bậc nhất của hai 
biến số , x p và tìm nghiệm hệ phương trình vi phân đĩ ứng với các điều 
kiện biên 0 (0)=x x , ( )=T Tx x nếu điểm cuối là cho trước hoặc ( ) = 0Tp 
nếu điểm cuối là bất kỳ. 
46 
3. Thay ngược nghiệm ( ), ( )t tx p tìm được vào quan hệ ( , )u x p đã cĩ từ 
bước 1 để được nghiệm tối ưu *( )tu của bài tốn. 
3.1.2. Bộ điều khiển LQR (Linear Quadratic Regulator) 
Cĩ thể thấy việc áp dụng nguyên lý 3 bước nêu trên của phương pháp 
biến phân là hồn tồn khơng đơn giản cho hệ phi tuyến vì cho tới nay ta vẫn 
chưa cĩ được phương pháp tìm nghiệm tường minh của hệ phương trình vi 
phân phi tuyến (bước 2). Bởi vậy người ta thường chỉ áp dụng cho bài tốn cĩ 
hệ (3.2) ở dạng tuyến tính tham số hằng (linear): 
 = +& A Bx x u (3.6) 
cĩ = ∞T (khoảng thời gian xảy ra quá trình tối ưu cho trước là vơ cùng), hàm 
mục tiêu (3.3) ở dạng tồn phương (quadratic): 
 ( )
0
( ) ∞∫= +T TJ Q R dtu x x u u (3.7) 
và điểm cuối 
Tx là bất kỳ, trong đĩ Q là ma trận đối xứng bán xác định dương 
( 0= ≥TQ Q ), R là ma trận đối xứng xác định dương ( 0= >TR R ) cho trước. 
Ở trường hợp đặc biệt này, nghiệm tối ưu *u tìm được theo phương pháp 
biến phân sẽ cĩ dạng on - line [5]: 
* 1 T
LQR
R B L R−= − = −u x x với 1−= T
LQR
R R B L (3.8) 
trong đĩ L là nghiệm đối xứng bán xác định dương của phương trình đại 
số Riccati: 
1−
− − =
T TLBR B L A L LA Q (3.9) 
Lúc này 
LQR
R cho bởi cơng thức (3.8) sẽ được gọi là bộ điều khiển (regulator) 
phản hồi trạng thái tối ưu. 
3.1.3. ðiều kiện đủ cho tính ổn định của hệ LQR 
Hệ LQR được hiểu là hệ kín gồm đối tượng tuyến tính tham số hằng 
(3.6) và bộ điều khiển phản hồi trạng thái (3.8), như được mơ tả ở hình 3.1. 
Do bài tốn tối ưu này cĩ điểm cuối 
Tx là bất kỳ nên chưa thể khẳng định 
47 
được hệ LQR đĩ là đã ổn định, tức là chưa thể khẳng định được là ở hệ LQR 
cũng sẽ cĩ: 
 lim ( )
→∞
= = 0T
t
tx x 
Tuy nhiên, nếu một trong các điều kiện nêu sau đây được thỏa mãn (điều 
kiện đủ), thì ta luơn khẳng định được hệ LQR là ổn định [5]: 
− Bài tốn cĩ 0= >TQ Q , tức là ma trận Q là xác định dương chứ khơng 
chỉ là bán xác định dương. 
− Nghiệm L tìm được của phương trình Riccati (3.9) là xác định dương 
(chứ khơng chỉ là bán xác định dương) 
− Cặp ma trận ( , )AQ là quan sát được. 
 Hình 3.1. Hệ kín với bộ điều khiển phản hồi trạng thái tối ưu LQR 
3.1.4. Áp dụng nguyên tắc điều khiển LQR để điều khiển tối ưu hệ tuyến 
tính bám ổn định theo giá trị đầu ra cho trước 
ðể tạo được khả năng sử dụng bộ điều khiển LQR như trên vào bài tốn 
điều khiển dự báo hệ song tuyến bám theo được giá trị đầu ra cho trước, sẽ 
được trình bày ngay ở mục 3.2 sau đây, trong mục nhỏ này luận án sẽ tiến 
hành biến đổi một chút ít bộ điều khiển LQR (3.8) để cĩ thể áp dụng được 
vào bài tốn điều khiển tối ưu hệ tuyến tính tham số hằng: 
= +

= +
& A B
C D
x x u
y x u
 (3.10) 
sao cho đầu ra y của nĩ bám theo được giá trị đầu ra mẫu ry cho trước. Sau 
đây bài tốn này sẽ được luận án gọi là bài tốn điều khiển bám tối ưu. 
Trước tiên, do khơng phải bài tốn điều khiển bám nào cũng cĩ nghiệm, 
nên ta cần cĩ các giả thiết sau cho bài tốn điều khiển bám tối ưu: 
xu 
r
y Hệ liên 
tục tuyến 
tính 
Bộ điều 
khiển tối 
ưu LQR 
48 
− Bài tốn bám tối ưu hệ tuyến tính tham số hằng (3.10) cĩ nghiệm 
eu ở 
chế độ xác lập, trong đĩ ký hiệu chỉ số e để nĩi rằng đĩ là tín hiệu mà 
với nĩ cĩ được →
r
y y , 
− Khi hệ đã bám theo được giá trị mẫu 
ry , tức là khi đã cĩ = ry y , thì hệ 
sẽ xác lập với trạng thái xác lập là 
ex . 
Với hai giả thiết nêu trên, hiển nhiên phải cĩ: 
= = +

= +
0 &
e e e
r e e
A B
C D
x x u
y x u
 (3.11) 
và điều này tương đương với: 
0
e
r e
A B
C D
    
=    
    
x
y u
 ⇔ 
1 0e
e r
A B
C D
−
    
=    
    
x
u y
 (3.12) 
Tiếp theo ta đặt biến mới: 
 = −
e
x xδ và = −
e
u uρ 
thì khi trừ từng vế của (3.10) và (3.11) cho nhau, sẽ được (gọi là hệ sai số): 
 = +& A Bδ δ ρ (3.13) 
và bài tốn điều khiển bám theo giá trị đặt 
ry ở đầu ra cho hệ tuyến tính tham 
số hằng ban đầu là (3.10) nay đã trở thành bài tốn điều khiển ổn định cho hệ 
sai số (3.13). 
Áp dụng phương pháp điều khiển LQR cho hệ sai số ứng với hàm mục tiêu: 
 ( )
0
( ) ∞∫= +T TJ Q R dtρ δ δ ρ ρ (3.14) 
cĩ ,Q R đều là hai ma trận đối xứng xác định dương, ta sẽ được: 
* 1−
= −
TR B Lρ δ với 1−= T
LQR
R R B L (3.15) 
trong đĩ 0= >TL L là nghiệm đối xứng xác định dương của phương trình 
Riccati (3.9). Tất nhiên bộ điều khiển LQR (3.15) này sẽ làm ổn định hệ sai 
số (3.13), vì ở đây cĩ Q là ma trận xác định dương. 
49 
Từ bộ điều khiển LQR (3.15) của hệ sai số (3.13) ta cũng suy ra được bộ 
điều khiển bám tối ưu theo giá trị đầu ra đặt trước 
ry cho hệ tuyến tính tham 
số hằng ban đầu (3.10) như sau: 
* 1 ( )−= − −Te eR B Lu u x x (3.16) 
3.2. Phương pháp đề xuất để điều khiển dự báo với cửa sổ dự báo vơ hạn cho 
hệ song tuyến liên tục khơng dừng, bám theo được giá trị đầu ra cho trước 
Dựa trên phương pháp điều khiển xây dựng trên nền biến phân đã được 
luận án giới thiệu ở mục 3.1.4, để điều khiển bám ổn định hệ tuyến tính tham 
số hằng mơ tả bởi (3.10), sau đây luận án sẽ mở rộng tiếp thành một đề xuất 
phương pháp điều khiển dự báo cho bài tốn điều khiển bám ổn định theo quỹ 
đạo tín hiệu đầu ra mẫu cho hệ song tuyến liên tục, thay vì chỉ điều khiển ổn 
định, và sử dụng trực tiếp mơ hình liên tục đĩ trong mơ hình dự báo, thay vì 
sử dụng mơ hình xấp xỉ khơng liên tục của nĩ. 
3.2.1. Tư tưởng chính của phương pháp 
Xét hệ song tuyến MIMO, khơng dừng, cĩ số tín hiệu đầu vào bằng số 
các tín hiệu đầu ra, mơ tả bởi mơ hình liên tục: 
( , ) ( , )
( , ) ( , )
= +

= +
& A t B t
C t D t
x x x x u
y x x x u
 (3.17) 
trong đĩ ∈ mRu là vector của m tín hiệu đầu vào, ∈ mRy là vector của m 
các tín hiệu đầu ra và ∈ nRx là vector của n biến trạng thái trong hệ. Các ma 
trận ( , ), ( , ), ( , )A t B t C tx x x và ( , )D tx đều cĩ những phần tử là hàm số phụ 
thuộc biến trạng thái x cũng như thời gian t . Bài tốn điều khiển đặt ra ở đây 
là xác định bộ điều khiển phản hồi trạng thái sao cho tín hiệu đầu ra y của hệ 
bám theo được giá trị đầu ra mong muốn 
r
y cho trước. 
Giả sử tất cả các ma trận ( , ), ( , ), ( , ), ( , )A t B t C t D tx x x x là liên tục theo 
x và t . Khi đĩ, ở thời điểm 
k
t hiện tại và trong khoảng thời gian 
≤ < +
k k k
t t t T đủ nhỏ, hệ song tuyến (3.17) sẽ xấp xỉ được bởi mơ hình tuyến 
tính tham số hằng: 
50 
 :
= +

= +
&
k k
k
k k
A B
H
C D
x x u
y x u
 (3.18) 
trong đĩ: 
( , ) , ( , ) , ( , ) , ( , )≈ ≈ ≈ ≈k k k kA t A B t B C t C D t Dx x x x khi ≤ < +k k kt t t T (3.19) 
 Việc xấp xỉ trên là hồn tồn chấp nhận được do từ giả thiết về tính liên 
tục của các ma trận tham số mơ hình (3.17) luơn cĩ: 
0 0 0 0
lim ( , ) , lim ( , ) , lim ( , ) , lim ( , )
→ → → →
= = = =
k k k k
k k k k
T T T T
A t A B t B C t C D t Dx x x x
và 
k
T là thời gian tính tốn cần thiết cho một vịng lặp của bộ điều khiển dự 
báo, nên rất nhỏ đối với card DSP1103 mà tác giả sử dụng khi tiến hành thực 
nghiệm thì 70kT ns= . Nĩ cũng sẽ chính là khoảng dịch chuyển của cửa sổ dự 
báo. 
 Hình 3.2. Mơ tả tư tưởng của phương pháp 
Nhờ việc xấp xỉ mơ hình song tuyến liên tục khơng dừng (3.17) thành vơ 
số mơ hình LTI (3.18) ứng với 0,1,= Kk nên bài tốn điều khiển bám giá trị 
đầu ra mẫu 
r
y của hệ song tuyến (3.17) trở thành bài tốn bám tín hiệu ra 
mẫu 
r
y cho tất cả vơ số hệ LTI (3.18). Và như vậy, các bước điều khiển trong 
một vịng lặp sẽ là: 
t kt 1+kt 
k
T 
[ ], [ ]
e e
k kx u 
[ 1], [ 1]+ +e ek kx u 
Cửa sổ dự báo vơ hạn 
Ở thời điểm hiện tại hệ được 
xấp xỉ bởi mơ hình LTI kH . 
Ở thời điểm tiếp theo hệ 
được xấp xỉ bởi mơ hình LTI 
1kH + . 
51 
Tư tưởng của phương pháp được đề xuất: 
1. Tại thời điểm hiện tại 
kt đo giá trị ( ) =k ktx x và xác định các ma trận hằng 
của mơ hình LTI (3.18) gồm , , ,k k k kA B C D theo các cơng thức: 
( , ), ( , ), ( , ), ( , )= = = =k k k k k k k k k k k kA A t B B t C C t D D tx x x x (3.20) 
2. Xác định tín hiệu điều khiển ( )tu để hệ LTI (3.18) bám theo được giá trị 
tín hiệu đầu ra mẫu ry . 
3. ðưa ( )tu vừa tìm được vào điều khiển hệ song tuyến (3.17) rồi quay về 
bước 1 để thực hiện vịng lặp mới tại thời điểm tiếp theo là 1+kt 
3.2.2. Xây dựng thuật tốn điều khiển 
Như vậy, ở thời điểm hiện tại kt hệ song tuyến liên tục khơng dừng 
(3.17) đã được xấp xỉ bởi mơ hình LTI (3.18) và tất nhiên mơ hình xấp xỉ này 
cũng sẽ chỉ được sử dụng trong khoảng thời gian 1+≤ <k kt t t của một vịng 
lặp, như mơ tả ở hình 3.2, trong đĩ 1k k kt t T+ = + với kT là thời gian tính tốn 
cần thiết cho một vịng lặp. Như vậy 
kT sẽ là vơ cùng nhỏ và việc xấp xỉ mơ 
hình song tuyến (3.17) với tính liên tục của các ma trận ( , ), ( , )A t B tx x , 
( , ), ( , )C t D tx x thành mơ hình LTI (3.18) trong khoảng thời gian 1+≤ <k kt t t 
là hồn tồn chấp nhận được. 
Gọi 
r
y là tín hiệu đầu ra mẫu mà hệ LTI (3.18) cần phải bám theo. ðây 
cũng chính là bài tốn đã được trình bày ở mục 3.1.4 trước đây. Do đĩ nếu ký 
hiệu [ ], [ ]e ek kx u là giá trị trạng thái và điều khiển của hệ LTI (3.18) ở chế độ 
xác lập, tức là khi hệ đã bám theo được giá trị đầu ra mẫu ry , thì những giá trị 
xác lập này phải thỏa mãn: 
[ ] [ ]
[ ] [ ]
= +

= +
0
k e k e
r k e k e
A k B k
C k D k
x u
y x u
 (3.21) 
Từ đây ta suy ra được hệ gồm +n m phương trình cho +n m ẩn số 
( )[ ], [ ]e ek kx u như sau: 
[ ] [ ]
[ ] [ ]
+   
=   +   
0k e k e
k e k e r
A k B k
C k D k
x u
x u y
 ⇔ 
[ ]
[ ]
    
=    
    
0k k e
k k e r
A B k
C D k
x
u y
52 
⇔ 
1[ ]
[ ]
−
     
=     
     
0e k k
e k k r
k A B
k C D
x
u y
 (3.22) 
và đĩ cũng là hệ phương trình cho phép xác định các giá trị xác lập 
( )[ ], [ ]e ek kx u của hệ từ tín hiệu đầu ra mẫu ry . 
Lại đặt các biến mới giống như đã làm ở mục 3.1.4: 
 [ ]= −
e
kx xδ và [ ]= −
e
ku uρ 
thì do ( )[ ], [ ]e ek kx u là những vector hằng số, ta sẽ cĩ từ (3.18) và (3.21) mơ 
hình hệ sai số như sau: 
 = +& k kA Bδ δ ρ (3.23) 
Như vậy, bài tốn điều khiển hệ (3.18) bám theo giá trị đầu ra mẫu ry đã 
được chuyển thành bài tốn điều khiển ổn định hệ sai số (3.23). ðể thiết kế bộ 
điều khiển dự báo cho hệ tuyến tính liên tục (3.23) cĩ được chất lượng ổn 
định tối ưu, ta sẽ áp dụng phương pháp điều khiển tối ưu LQR cho bước dịch 
chuyển cửa sổ dự báo thứ k với độ rộng của cửa sổ dự báo là vơ hạn, được 
đánh giá bởi hàm mục tiêu mơ tả sai số dự báo ở thời tương lai như sau: 
 ( )1( ) min2
∞
= + →∫
k
T T
k k k
t
J Q R dtρ δ δ ρ ρ (3.24) 
trong đĩ , 
k k
Q R là hai ma trận đối xứng xác định dương tùy chọn, thay đổi 
được theo từng bước dịch chuyển của cửa sổ dự báo. Việc tùy chọn hai ma 
trận , k kQ R này sẽ là một cơ hội để sau này thuật tốn cịn cĩ khả năng thỏa 
mãn thêm điều kiện ràng buộc. 
Áp dụng phương pháp biến phân để tìm nghiệm *ρ của bài tốn tối ưu ở 
quá trình quá độ, mơ tả bởi (3.23), (3.24), ta sẽ cĩ (xem lại mục 3.1.2): 
1−
− − =
T T
k k k k k k k k k kL B R B L L A A L Q (3.25) 
và ( )* 1 1 [ ]− −= − = − −T Tk k k k k k eR B L R B L kx xρ δ 
Từ đây ta cũng đến được tín hiệu điều khiển cho hệ song tuyến liên tục 
và khơng dừng (3.17) ban đầu tại cửa sổ dự báo hiện tại: 
53 
 ( )
* *
1
( ) [ ] ( )
[ ] [ ]−
= +
= − −
e
T
e k k k e
t k t
k R B L k
u u
u x x
ρ
 (3.26) 
và tất nhiên tín hiệu điều khiển này chỉ sử dụng được trong đúng khoảng thời 
gian hiện tại là 1+≤ <k kt t t . 
Tổng kết lại thì bộ điều khiển dự báo với cửa sổ dự báo vơ hạn, áp dụng 
cho hệ song tuyến liên tục khơng dừng (3.17), làm việc theo thuật tốn đề 
xuất ở trên sẽ gồm các bước lặp như sau: 
Thuật tốn 3.1: ðiều khiển dự báo phản hồi trạng thái để tín hiệu ra bám 
theo tín hiệu đầu ra mẫu cho hệ song tuyến liên tục với cửa sổ dự 
báo vơ hạn. 
1. Chọn quy luật thay đổi các ma trận trọng số ,k kQ R đối xứng xác định 
dương. Gán 0 0=t và 0=k . 
2. ðo ( )=
k k
tx x và tính xấp xỉ các ma trận hằng , , ,
k k k k
A B C D của mơ hình 
LTI (3.18) từ ( , ), ( , ), ( , ), ( , )A t B t C t D tx x x x theo cơng thức (3.20). 
3. Xác định ( )[ ], [ ]e ek kx u từ ry theo (3.22). 
4. Tìm 
k
L là nghiệm đối xứng, bán xác định dương của phương trình đại số 
Riccati (3.25). Tính *u theo (3.26). 
5. ðưa *u vào điều khiển đối tượng song tuyến liên tục khơng dừng (3.17) 
rồi gán : 1= +k k và quay về 2. 
Với thuật tốn chi tiết như trình bày trên đây thì khoảng thời gian kT cho việc 
xấp xỉ (3.17) thành (3.18) chính là khoảng thời gian cần thiết đề thực hiện các 
phép tính từ bước 2 đến bước 5. 
3.2.3. Khả năng xử lý điều kiện ràng buộc 
Trong thuật tốn trên cĩ hai ma trận tham số ,k kQ R là tùy chọn. Ta cĩ 
thể chọn chúng thay đổi theo sự dịch chuyển của cửa sổ dự báo, tức là theo 
, 0,1, = Kkt k sao cho nghiệm bài tốn cịn cĩ thể thỏa mãn thêm được điều 
kiện ràng buộc: 
 ≤ Ω∈Rρ (3.27) 
54 
với Ω là giá trị chặn trên cho trước, trong khi chất lượng [ ]= − → 0
e
kx xδ 
vẫn được đảm bảo. 
Theo nguyên lý thay đổi ,k kQ R giới thiệu ở tài liệu [1] thì: 
− Khi kR càng lớn, điều kiện ràng buộc (3.27) càng dễ được thỏa mãn. 
− Khi kQ càng lớn, càng dễ đạt được chất lượng [ ]= − → 0e kx xδ . 
Khơng bao giờ cả hai ma trận tham số ,
k k
Q R cùng được tăng hoặc giảm 
tại một bước dịch chuyển của cửa sổ dự báo. 
Như vậy, theo nguyên lý này ta cĩ thể xác định quy luật thay đổi ,k kQ R 
là giảm dần 
k
R (sau khi điều kiện ràng buộc (3.27) đã được thỏa mãn), hoặc 
tăng dần 
k
Q cùng với k , tức là cùng với sự dịch chuyển của cửa sổ dự báo. 
Ngồi ra, để cài đặt thuật tốn, ta cần đến phương pháp giải phương trình 
đại số Riccati (3.25). Một số phương pháp tìm nghiệm 
kL hữu ích cho 
phương trình Riccati này đã được giới thiệu ở tài liệu [5]. 
3.2.4. Chứng minh tính bám ổn định của phương pháp được đề xuất 
Hình 3.3 minh họa hệ điều khiển dự báo với bộ điều khiển làm việc theo 
thuật tốn 3.1 vừa đề xuất. 
Hệ kín này làm việc theo nguyên lý phản hồi trạng thái và hiển nhiên 
khơng phải là hệ rời rạc, vì ở đĩ cĩ *( ), ( )t tx u là vector các hàm liên tục. 
Trong mỗi một cửa sổ điều khiển với độ rộng vơ hạn [ ],∞k , tín hiệu *( )tu 
được đưa vào điều khiển đối tượng trong đúng một khoảng thời gian tính tốn 
của một vịng lặp 1+≤ <k kt t t . Bởi vậy ta cĩ thể ký hiệu *( )k tu thay vì *( )tu . 
Trong suốt quá trình điều khiển, tín hiệu điều khiển ( )tu sẽ chính là dãy ghép 
nối các tín hiệu liên tục *( ), 0,1, = Kk t ku này. Vì vậy hệ kín đĩ là thuộc 
nhĩm hệ thống dữ liệu mẫu (sampled data systems) [4]. 
Khi áp dụng phương pháp biến phân của điều khiển tối ưu, trong hình 
3.3, khi dùng cửa sổ dự báo vơ hạn chúng ta cảm thấy mất đi mơ hình dự báo 
nhưng phương pháp này vẫn được gọi là điều khiển dự báo vì nĩ vẫn thực 
hiện được việc cực tiểu hĩa sai lệch dự báo từ thời điểm hiện tại cho đến vơ 
55 
cùng ở tương lai và nguyên tắc dịch cửa sổ dự báo cũ vẫn được giữ nguyên ở 
phương pháp đề xuất này theo nguyên lý Receding Horizon Control (chiến 
lược điều khiển dịch dần về tương lai) nên thực chất vẫn là điều khiển dự báo. 
Hình 3.3. ðiều khiển dự báo hệ song tuyến liên tục với cửa sổ dự báo vơ hạn 
Về tính ổn định của hệ kín trong hình 3.3, ta cĩ phát biểu sau: 
ðịnh lý 3.1: Nếu các ma trận , , 0,1, = Kk kQ R k là đối xứng xác định 
dương và: 
 
 
 
k k
k k
A B
C D
 (3.28) 
khơng suy biến thì ở hệ điều khiển dự báo cho trong hình 3.3 sẽ cĩ 
→
r
y y . 
Chứng minh: 
Hiển nhiên, với giả thiết (3.28) thì sẽ đủ nếu ta chứng minh được ( )tδ 
là bị chặn và cĩ ( ) → 0tδ , trong đĩ ( )tδ là quỹ đạo sai lệch trạng thái trên 
tồn bộ trục thời gian, cĩ được nhờ ghép tất cả các quỹ đạo thành phần trong 
từng cửa sổ dự báo (hình 3.3). 
Xét cửa sổ dự báo thứ kt bất kỳ. Do ,k kQ R là đối ứng xác định dương, 
nên hệ kín với mơ hình sai lệch: 
 ( )1−= − = )& Tk k k k k kA B R B L Aδ δ δ ứng với 1+≤ <k kt t t cĩ: 
1−
= −
)
T
k k k k k kA A B R B L 
là ổn định. Bởi vậy 
)
kA là ma trận Hurwitz [4]. 
k
y
x
k
x
y
[ ]
e
kx
*u 
[ ]
e
ku
*ρ
( )tδ
k
t 1+kt lt 
k
δ
1+kδ
l
δ 
k
T
kx
, , ,
k k k k
A B C D
ry
Hệ song 
tuyến 
Mơ 
hình dự 
báo 
Tối ưu 
động 
1− T
k k kR B L
56 
Hơn nữa, hệ trên cĩ quỹ đạo trạng thái trong tồn bộ khoảng thời gian là: 
( )( ) −=
)
k kA t t
kt eδ δ , trong đĩ ( )=k ktδ δ 
Bởi vậy ta suy ra được với mọi 0≥t : 
1 1
( )
( ) ( )
1 1 1 1
1
1 0
0
( )
exp ( ) ( )
exp ( ) ( )
− −
−
− −
− − − −
−
+
=
=
 = = − + − 
 
= − + −∑  
)
) ) ) )
M
) )
k k
k k k k k
A t t
k
A t t A t t
k k k k k k k
k
k k i i i
i
t e
e e A t t A t t
A t t A t t
δ δ
δ δ
δ
Ngồi ra, vì 1 0+ − >i it t và tất cả các ma trận: 
 ( )−)k kA t t và 1( )+ −
)
i i iA t t với 0,1, , 1= −Ki k 
là Hurwitz, tức là: 
 limexp ( ) ,k k
t
A t t k
→∞
− = Θ ∀
)
 (ma trận cĩ tất cả các phần tử bằng 0) 
cũng như: 
1
1
0
exp ( )k i i i
i
A t t
−
+
=
−∑
)
 là hữu hạn 
nên: 
 lim ( ) 0
→∞
=
t
tδ 
và đĩ chính là điều phải chứng minh. ■ 
3.2.5. Khả năng áp dụng cho hệ phi tuyến affine khơng dừng 
Phương pháp điều khiển dự báo đề xuất ở trên cùng với thuật tốn 3.1 
cho hệ song tuyến liên tục, khơng dừng cũng hồn tồn áp dụng được cho cả 
những hệ phi tuyến affine khơng dừng, mơ tả bởi: 
 ( , ) ( , )= +& t B tx f x x u 
nếu như ở đĩ cĩ vector hàm ( , )tf x liên tục theo t và khi 0→x thì ( )f x 
cũng tiến về 0 với tốc độ nhanh hơn 0→x . Thật vậy, với giả thiết nêu trên thì: 
 2
( , )( , ) ( , )= =
Tt
t A t
f x x
f x x x x
x
 trong đĩ 2
( , )( , ) =
Tt
A t
f x x
x
x
57 
tức là hệ song tuyến tương đương: 
 ( , ) ( , )= +& A t B tx x x x u 
cũng sẽ cĩ ma trận ( , )A tx là liên tục theo x . 
3.3. Kết luận chương 3 
Tồn bộ nội dung chương 3 là đề xuất mới của luận án về phương pháp 
điều khiển dự báo cho hệ phi tuyến liên tục khơng dừng nĩi chung và cho hệ 
song tuyến liên tục khơng dừng nĩi riêng. Phương pháp đề xuất này được xây 
dựng trên nền phương pháp biến phân của điều khiển tối ưu và áp dụng được 
cho cả bài tốn điều khiển ổn định cũng như bài tốn điều khiển bám ổn định 
theo giá trị mẫu cho trước ở đầu ra. Nĩ cũng đã được luận án thể hiện chi tiết 
dưới dạng thuật tốn 3.1 cũng như ở định lý 3.1 ch

File đính kèm:

  • pdfluan_an_nghien_cuu_xay_dung_thuat_toan_dieu_khien_du_bao_the.pdf
  • docThong tin LA NCS Nguyen Thi Mai Huong 02-2016 DHTN Jun.doc
  • pdfTom tat Tieng Anh NCS Nguyen Thi Mai Huong 02-2016.pdf
  • pdfTom tat Tieng Viet NCS Nguyen Thi Mai Huong 02-2016 DHTN.pdf