Luận án Điều khiển dự báo phản hồi đầu ra theo nguyên lý tách cho hệ phi tuyến
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
Bạn đang xem 10 trang mẫu của tài liệu "Luận án Điều khiển dự báo phản hồi đầu ra theo nguyên lý tách cho hệ phi tuyến", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.
Tóm tắt nội dung tài liệu: Luận án Điều khiển dự báo phản hồi đầu ra theo nguyên lý tách cho hệ phi tuyến
ef exwkkk=− và vuukk=−k : ref / efewvuwfevkkkkk++11=+(, +−=k ) (,). kk (3.3) Mô hình mô tả sai lệch bám (3.3) này cũng sẽ được sử dụng để dự báo các giá trị sai lệch bám eki+ trong khoảng cửa sổ dự báo [kk, + N). Như vậy với mô hình (3.3), bài toán điều khiển bám ổn định đã được chuyển về bài toán điều khiển ổn định. Để tránh việc sử dụng quá nhiều ký hiệu, từ nay về sau, ta vẫn sử dụng ký hiệu uk thay vì vk cho tín hiệu vào ở bài toán điều khiển bám. Khi đó, tương ứng với bài toán điều khiển bám, hàm mục tiêu cho việc xây dựng bộ điều khiển dự báo phản hồi trạng thái cũng có cấu trúc phụ thuộc theo sai lệch ek tức là: N −1 JfkkNkikiki=+()eeu++++∑ g(, ) (3.4) i=0 trong đó g ⋅⋅, và f ⋅ là các hàm xác định dương với f ⋅ là điều kiện ràng buộc cho điểm ki+ () () ( ) cuối. Đặc biệt trong hàm mục tiêu (3.4) thì gki+ (⋅,⋅) có cấu trúc thay đổi theo i chứ không cố định như được giả thiết ở các công trình trước [23,47]. Chính vì lý do đó nên ta gọi Jk là hàm mục tiêu có cấu trúc biến đổi. Ghép chung mô hình sai lệch (3.3) trên với hàm đo tổng các giá trị sai lệch thuộc khoảng dự báo [,kk+ N ) vừa có, ta sẽ được bài toán tối ưu động có cấu trúc giống với bài toán quy hoạch * động dạng chuẩn, phục vụ việc xác định tín hiệu điều khiển tối ưu uk tại thời điểm k , như sau: ⎧efeu= / (, ) ⎪ ki++1 ki + ki + ⎨ N −1 (3.7) JfkkNkikiki=+()eeu++++∑ g(, ) → min. ⎪ uu, , ⎩ i=0 kkN+−1 Thậm chí vì nhiều lý do mà trong điều khiển dự báo người ta cần đến cả các bài toán tối ưu có hàm mục tiêu Jk không bắt buộc ở dạng (3.4) mà tổng quát hơn sẽ là hàm nhiều biến: 7 JfkkNkkkk=+()eeueueu++++−+− F(, ,11 , , , kNkN 1 , 1 ) (3.8) mà ở đó khi sử dụng ký hiệu: FFi==− i(,eu ki+ ki + , , e kN +−11 , u kN +− ), i0,,1 N (3.9) là thành phần hàm con trong FF= 0 , thì Fi có thể tách được thành dạng tổng: Fgikikikii=+++(,eu + ) F +1 (3.10) hoặc dạng tích: Fgikikikii=⋅++(,eu + ) F +1 . (3.11) Những hàm mục tiêu dạng (3.8) sẽ được gọi là hàm mục tiêu có cấu trúc biến đổi nếu như nó thỏa mãn nguyên lý tối ưu đối với hàm mục tiêu Jk có cấu trúc biến đổi. Cụ thể hơn, khi ký hiệu hàm Bellman tại i là: BFiki()e + = min i (3.12) uu, , ki+−kN+ 1 thì vẫn phải có được: Bgiki()min(,eeue+++++++=+[] kikiki ) B i11 ( ki ) (3.13) uki+ nếu dạng tách được là (3.10), hoặc: Bgiki()min(,eeue+++++++=⋅[] kikiki ) B i11 ( ki ) (3.14) uki+ nếu dạng tách được là (3.11). Kết luận trên sẽ được trình bày dưới dạng hệ quả 3.1 của định lý 1.3 như sau. Hệ quả 3.1: Xét hàm Jk dạng tổng quát (3.8) được định nghĩa trong toàn bộ khoảng dự báo [,kk+ N ). Ký hiệu Fi là thành phần của Jk xác định trong khoảng con [,kikN++ ) cho bởi (3.9). Nếu hàm Fi đó tách được theo một trong hai dạng (3.10) hoặc (3.11) và g (,eu )0≥ i ki++ ki ki + thì hàm Bellman (3.12) tại sẽ tương ứng thỏa mãn (3.13) hoặc (3.14). 3.1.2 Phân tích tính ổn định Với cửa sổ dự báo là vô hạn, tức N = ∞, thì khả năng ổn định của hệ kín là rất lớn [17], do đó ta có thể biến đổi bài toán quy hoạch động (3.7) với cửa sổ dự báo hữu hạn thành bài toán có cửa sổ dự báo vô hạn như sau: ⎧efeu= / (, ) ⎪ ki++1 ki + ki + ⎨ N −1 (3.15) ⎪JgkkikikiNkN=+→∑ ++(,eu + ) B ( e + ) min i=0 uukkN, , +−1 ⎩ trong đó BNkN()e + được giả định là hàm Bellman tại bước N trong cửa sổ dự báo vô hạn [,k ∞ ]: ∞ BgNkN()min(,).eeu++++= ∑ kikiki u , kN+ iN= Bộ điều khiển dự báo làm việc theo vòng lặp. Tại mỗi vòng lặp nó thực hiện tìm nghiệm bài toán tối ưu (3.15). Để tiện cho việc trình bày sau này, ta sẽ sử dụng ký hiệu Vk(,)ek để chỉ giá trị Jk,min của bài toán tối ưu (3.15) ở từng vòng lặp k đó. Như vậy, ở mỗi vòng lặp k thì Vk(,)ek chính là hàm Bellman của bài toán tối ưu động (3.15) ứng với i = 0 : VkB(,)eekkk==0,min () J . 8 Hệ quả 3.2: Nếu hàm Bellman giả định BNkN()e + trong (3.15) được chọn tương ứng với khoảng thời gian còn lại []N ,∞ sao cho ở tất cả các vòng lặp k luôn có: ααee≤≤Vk(,) e (3.16) 12()kk() k và hàm g (,eu )trong dấu tổng của J thỏa mãn: kk k k * gkk(,eue kk ())≥ α3 () e k (3.17) * trong đó α123, αα, ∈K , thì uekk() của bộ điều khiển dự báo sẽ làm hệ sai lệch (3.3) ổn định tiệm cận. 3.2 Quan sát trạng thái hệ phi tuyến Để sử dụng được bộ điều khiển dự báo phản hồi trạng thái ở mục 3.1 thì rõ ràng phải có điều kiện là tất cả các biến trạng thái nằm bên trong hệ là đo được. Tuy nhiên trong nhiều ứng dụng thực tế, thông tin về trạng thái của hệ không thể đo được đầy đủ mà chỉ có tín hiệu ra của hệ là đo được: yhxukkk= (, ). (3.19) Do đó để áp dụng được các phương pháp điều khiển dự báo phản hồi trạng thái đã có, vector trạng thái x của hệ phải được ước lượng từ vector tín hiệu ra y đo được và vector tín hiệu vào k k uk đã biết nhờ sử dụng một bộ quan sát trạng thái thích hợp. 3.2.1 Các vấn đề chung của quan sát trạng thái Gộp các phương trình (3.1) và (3.19), ta có đối tượng (quá trình) phi tuyến không liên tục: xfxu= (, ), kkk+1 (3.20) yhxukkk= (, ). Định nghĩa 3.1 [9,25,4]: Hệ (3.20) được gọi là quan sát được, nếu mọi giá trị trạng thái x0 của nó là xác định được từ M giá trị đo được uk , yk , kM= 0,1, ,− 1 của hệ. Để làm rõ hơn nữa định nghĩa trên, ta ký hiệu: xx=Φf (,),kk =0,1, ,1 M − (3.21) k U 0 là nghiệm phương trình sai phân trong mô hình (3.22) của hệ (phương trình thứ nhất), ứng với dãy giá trị tín hiệu vào: U = {,,uu ,} u (3.22) 01M − 1 và x0 là trạng thái đầu. Với ký hiệu (3.21) này và do uk đã có trong U nên tín hiệu đầu ra của hệ (3.20) sẽ chỉ còn phụ thuộc vào trạng thái đầu x0 và dãy tín hiệu đầu vào U cho ở công thức (3.22), tức là: ff/ yhxuhkkk==Φ(, )UU (,), x00kk u k h Φ (,). x (3.23) ()( ) Tiêu chuẩn kiểm tra tính quan sát được Với các định nghĩa nêu trên, thì khi viết chung (3.23) cho kM= 0,1, ,− 1 cũng như thay x0 bởi x thành: 9 ⎛⎞hx/ Φf (,0) ⎜⎟()U ⎜⎟hx/ Φf (,1) ⎜⎟()U xx TU ()= (3.25) ⎜⎟ ⎜⎟ ⎜⎟/ f hx()Φ−U (,M 1) ⎝⎠ trong đó U được xem là tham số của ánh xạ TU ()x , thì hệ sẽ là quan sát được nếu tồn tại ít nhất một số nguyên dương M và một dãy tín hiệu điều khiển U theo (3.22) để ánh xạ TU ()x cho bởi (3.25) là nội xạ (injective). Nếu TU ()x còn có thêm tính chất là ánh xạ trơn, thì nó sẽ là nội xạ khi và chỉ khi (theo [29]): ∂T rankU =∀n. , x (3.26) ∂x Bởi vậy ta suy ra được các tiêu chuẩn sau: 1) Hệ (3.20) với các vector hàm trơn f (,),⋅ ⋅⋅⋅ h(,) sẽ quan sát được khi và chỉ khi tồn tại tham số U để có (3.26). 2) Hệ (3.20) với các vector hàm trơn f (,),⋅ ⋅⋅⋅ h(,) sẽ là quan sát đều khi và chỉ khi (3.26) đúng với mọi tham số U . 3.2.2 Xây dựng bộ quan sát trạng thái tối ưu Luận án đã xây dựng bộ quan sát trạng thái tối ưu làm việc theo nguyên tắc như sau. Tại thời điểm hiện tại kM+−1 bộ quan sát có nhiệm vụ xác định trạng thái xk ở thời điểm k trước đó của hệ (3.20) từ M các giá trị tín hiệu vào ra uki+ , yki+ , iM= 0,1, ,− 1 vừa đo được trong cửa sổ quan sát [,kk+ M ). Có thể thấy khi đã có xk thì dựa vào mô hình (3.20) của hệ ta cũng có xkM+ . Sau khi đã có xk ở thời điểm k và hệ chuyển sang thời điểm tiếp theo k +1, chu trình quan sát trên sẽ được lặp lại để có xk+1 với cửa sổ quan sát [1,)kkM+ + . Như vậy, bộ quan sát này sẽ dịch chuyển tương ứng từng bước từ [,kk+ M ) tới [1,kkM+ ++ 1), k = 0,1, . Rõ ràng để có thể quan sát được theo nguyên tắc làm việc như vậy, hệ phải là quan sát đều và độ rộng M của cửa sổ quan sát phải đủ lớn để ánh xạ T ()x ở công thức (3.25) là nội xạ. U Gọi xk là giá trị trạng thái quan sát được ở thời điểm k . Sử dụng ngay mô hình (3.20) của hệ làm mô hình quan sát: xfxuki++−+−= (, ki11 ki ) ta sẽ có: xfxuki++−+−= (, ki11 ki ) = ff( ( fxu(,kk ), u k++−11)) , , u ki ) (3.27) ii ==f (,,xuukkk++−11 , , u ki ) fx (,) kiU trong đó Ui là ký hiệu dãy hữu hạn của i các phần tử: Uikk= {,uu++−11 , , u ki }. Từ những giá trị trạng thái quan sát này ta có được sai lệch quan sát εi tại thời điểm ki+ : 10 εγi=− i()yhxu ki+++(, ki ki ) i =−γiki()yhfxu++((,),) kikiU (3.28) = γiiki()hx(,U +1 ) i với γi ∈K là hàm tùy chọn và hxiki(,UU+1 ) y ki++− hfx ((,),) ki u ki. Suy ra hàm mô tả sai lệch quan sát trong toàn bộ cửa sổ quan sát [,kk+ M ) sẽ là: MM−−11 Q()xhxkiiiki==∑∑εγ() (,U +1 ). (3.29) ii==00 Sai lệch quan sát εi cũng như hàm mục tiêu Q()xk trong các công thức (3.28) và (3.29) được viết ở dạng tổng quát. Tuy nhiên, trong ứng dụng, sẽ là đủ nếu ta sử dụng γi ()⋅∈K dạng đơn giản: T γi()hx iki(,UU++11 )= () hx iki (, )P ( hx iki (, U + 1 )) (3.30) T với PP=>0 tùy chọn. Khi đó với định nghĩa vector sai lệch quan sát ei như sau: ehxiiki= (,U +1 ) (3.31) thì hàm mục tiêu (3.29) trở thành: M −1 Q()xhxkiiki= ∑ γ () (,U +1 ) i=0 (3.32) MM −−11T T ==∑∑eiiPP e()() hx iki(,UU++11 ) hx iki (, ). ii==00 Vậy giá trị trạng thái quan sát tối ưu xk cần xác định phải là nghiệm của bài toán tối ưu phi tuyến: * xxkk= arg minQ ( ). (3.33) Trước khi đi đến định lý 3.1 sau đây về khả năng bộ quan sát tối ưu trên trở thành bộ quan sát FTO, ta cần có giả thiết sau. Giả thiết 3.2: a) Cửa sổ quan sát M là hữu hạn. b) Hàm Q()xk là lồi theo xk . * Định lý 3.1: Nếu bài toán tối ưu (3.33) có nghiệm xk thỏa mãn với ít nhất một chỉ số 0 ≤ lM< : l * a) γlklyhfx−=((,))0, klU (3.35) ()+ b) hàm tích ()()hf l ⋅ là nội xạ, (3.36) * thì ở đó cũng sẽ có xxkk= . Nếu định lý 3.1 đúng với mọi cửa sổ quan sát thì bộ quan sát tối ưu sẽ có tính chất là xác định được chính xác trạng thái thực của đối tượng sau một khoảng thời gian hữu hạn. Khi đó, bộ quan sát tối ưu trở thành bộ quan sát FTO. Trong trường hợp định lý 3.1 không được thỏa mãn, chẳng hạn khi hệ có nhiễu tác động, thì ta vẫn có khả năng nâng cao độ chính xác cho bộ quan sát tối ưu bằng cách mở rộng thêm cửa sổ quan sát. Điều này được khẳng định ở định lý sau. 11 Định lý 3.2: Nếu hệ (3.20) có f (,)⋅⋅ và h(,)⋅ ⋅ liên tục và quan sát đều, chuỗi (3.29) ứng với * M =∞ có Qmin hữu hạn, thì ở đó sẽ có xxkk= . 3.2.3 Cài đặt thuật toán quan sát tối ưu Dựa vào nguyên tắc làm việc của bộ quan sát trạng thái tối ưu được trình bày ở mục 3.2.2, thuật toán quan sát trạng thái tối ưu tổng quát sẽ có dạng cài đặt cụ thể như sau: Thuật toán 3.1: (Quan sát trạng thái tối ưu) 1) Chọn cửa sổ quan sát M và khai báo hai mảng dữ liệu đầu vào uy, có độ dài M với các phần tử được ký hiệu là uy[]iiiM∈∈=−RRmp , [] , 0,1, , 1. 2) Xây dựng hàm mục tiêu (3.29) có sử dụng (3.27), (3.28) cho bài toán tối ưu (3.33). 3) Gán k = 0 và đo M −1 giá trị vào ra đầu tiên của hệ (3.20) gồm uyki+ , ki+ , iM=−0,1, , 2. Đưa những giá trị đo được này vào hai mảng đã khai báo theo thứ tự: uuyy[]ii==ki++ , [] ki . 4) Lần lượt thực hiện các bước sau đây theo từng chu kỳ trích mẫu Ta : a) Trích mẫu uykM+−11, kM +− rồi gán vào mảng: uu[1]M −=kM+−1 , yy[1].M −=kM+−1 * * b) Giải bài toán tối ưu (3.33) để tìm xk . Nếu sử dụng các phương pháp lặp để tìm nghiệm xk * * thì giá trị khởi phát sẽ là xk−1 trong đó x−1 là tùy chọn. c) Dồn lại mảng dữ liệu bằng cách thực hiện M −1 các phép gán sau lần lượt với iM=−0,1, , 2 : uu[]:ii=+ [ 1], yy[]: ii =+ [ 1]. d) Gán kk:1=+ rồi quay lại bước a). 3.3 Tính ổn định của hệ điều khiển dự báo phản hồi đầu ra theo nguyên lý tách với hàm mục tiêu có cấu trúc biến đổi Hình 3.7 dưới đây mô tả nguyên lý làm việc của bộ điều khiển dự báo phản hồi trạng thái kết hợp với bộ quan sát tối ưu để trở thành bộ điều khiển dự báo phản hồi đầu ra. cửa sổ điều khiển tiếp theo cửa sổ điều khiển hiện tại thời điểm hiện tại k k +1 kM+ −1 kMN+ +−1 uu, , kkM+−1 uuu***, , , , , u * kkMkMkMN+−11 + ++− Hình 3.7: Nguyên tắc làm việc của bộ điều khiển dự báo phản hồi đầu ra theo nguyên lý tách. Bộ điều khiển phản hồi đầu ra ở hình 3.7 làm việc dọc theo trục thời gian k = 0,1, , cùng với cửa sổ điều khiển [kk, ++ M N). Cửa sổ điều khiển này chứa thời điểm hiện tại kM+ −1. Nó chia cửa sổ điều khiển thành hai đoạn, đoạn thứ nhất [kk, + M) thuộc về quá khứ, được sử * dụng để quan sát trạng thái xk ở thời điểm k từ các giá trị vào ra đo được là uukkM, , + −1 và yykkM, , +−1. Đoạn thứ hai [kMkNM+++, ) trong cửa sổ điều khiển thuộc về tương lai, 12 * được sử dụng để xác định tín hiệu điều khiển ukM+ theo nguyên tắc điều khiển dự báo phản hồi trạng thái *1MN+ − Bây giờ ta sẽ ký hiệu dãy giá trị {}uki+ 0 là nghiệm của bài toán tối ưu trong khoảng cửa sổ điều khiển hiện tại (xem hình 3.7): ⎧xfxu= (, ) ⎪ ki++1 ki + ki + ⎨ MN+−1 (3.45) ⎪JgkkikikiMNkMN=+→∑ +++(,xu ) B + ( x ++ )min ⎩ i=0 trong đó điểm trạng thái đầu xk là tùy ý nhưng cho trước. Như vậy, nếu toàn bộ cửa sổ điều khiển [kk, + N+ M) được xem là cửa sổ dự báo thì giá * *1MN+ − trị đầu tiên uxkk() của dãy {}uki+ 0 sẽ là tín hiệu điều khiển dự báo phản hồi trạng thái của bộ điều khiển dự báo ở thời điểm k . Khi đó hệ (3.20) cùng với bộ điều khiển dự báo phản hồi * trạng thái uxkk() lấy từ bài toán tối ưu (3.45) tạo thành hệ kín: * xfxuxkkkk+1 = ( , ( )). (3.46) Song vấn đề đặt ra ở đây là cửa sổ dự báo thật sự chỉ là khoảng con [,kMkNM+++ ) của * cửa sổ điều khiển, tức là tín hiệu điều khiển phản hồi về không phải là uxkk() ở thời điểm k, mà * *1MN+ − lại là uxkM++() kM ở thời điểm kM+ . Do đó ta cần phải chỉ ra được rằng nếu {}uki+ 0 là *1MN+ − nghiệm tối ưu cho toàn bộ cửa sổ điều khiển thì dãy con {}ukiM+ cũng sẽ là nghiệm tối ưu tương ứng với khoảng con [,kMkNM+++ ) trong đó. *1MN+− *1MN+ − Hệ quả 3.3: Nếu {}uki+ 0 là nghiệm tối ưu trong toàn bộ cửa sổ điều khiển thì {}ukiM+ sẽ là nghiệm tối ưu của đoạn cửa sổ dự báo trong cửa sổ điều khiển. Hệ quả 3.3 trên đây thực chất là sự mở rộng của hệ quả 1.1 cho trường hợp hàm mục tiêu có cấu trúc biến đổi. Với nội dung hệ quả 3.3 ở trên thì việc kiểm tra tính thỏa mãn nguyên lý tách của bộ điều khiển dự báo phản hồi đầu ra ở hình 3.7 sẽ thay được bằng việc kiểm tra tính ổn định * ** * của hệ (3.46) khi bộ điều khiển uxkk() được thay bằng uxkk(), trong đó xk là nghiệm của: * xxkk= arg minQ ( ) M 1 − i =−arg min∑ γiki()yhfx+ ( )( ki ,U ) (3.48) i=0 có Uik= {,uu , ki+−1 }, {,yykkM ,+ −1 } là các tham số đã biết. Từ hệ quả 3.2 của lý thuyết điều khiển dự báo bằng phản hồi trạng thái cho hệ (3.45) với cửa sổ dự báo là toàn bộ cửa sổ điều khiển (hình 3.7), ta đã được biết rằng khi giki+++(,xu ki ki )0,≥∀ và hàm Bellman giả định tại điểm cuối BMN+++()x kMN , còn gọi là hàm phạt, được chọn sao cho hàm Bellman (3.47) tại điểm đầu i = 0 ở các cửa sổ điều khiển [,kk++ M N ), k = 0,1, : VkB(,)xxkk= 0 () (3.49) là hàm hợp thức: α12()xxkk≤≤Vk (,)()α x k với α12, α ∈K (3.50) * thì bộ điều khiển tối ưu uxkk() của (3.46) sẽ làm hệ kín: xfxux= (,* ()) kkkk+1 ổn định tiệm cận. Khi đó Vk(,)xk sẽ là hàm LF tương ứng của hệ, tức là: 13 * VkVk()f (,xuxkkk ()),1+− (,) x k ≤−α3 ( x k ) trong đó α3 ∈K. Bây giờ ta sẽ kiểm tra tính thỏa mãn nguyên lý tách của hệ (3.46) khi thay bộ điều khiển * ** * phản hồi trạng thái uxkk() lấy từ bộ điều khiển phản hồi đầu ra uxkk(), trong đó xk là nghiệm của bộ quan sát tối ưu (3.48). Nói cách khác ta phải kiểm tra tính ổn định của hệ: ⎧xfxux= ,(),** ⎪ kkkk+1 () ⎨ M −1 (3.51) * i ⎪ xyhfxkikiki=−arg min ∑ γ + ( )( ,U ) . x () ⎩ k i=0 Định lý 3.3: Nếu bộ điều khiển dự báo phản hồi trạng thái ux* ()làm hệ ổn định ứng với hàm kk ** LF (3.50), thì bộ điều khiển phản hồi đầu ra uxkk() cũng sẽ làm hệ ổn định với mọi bộ quan sát trạng thái thỏa mãn: ααfx(, u** ()) x≤ fx (, u * ()). x (3.52) 21()kkk() kkk Có thể thấy ngay là những bộ quan sát FTO đều thỏa mãn điều kiện (3.52), ở đó dấu ""≤ được thay cụ thể bằng dấu ""= . Mặc dù đã đưa ra được điều kiện đủ (3.52) cho tính ổn định theo nguyên lý tách của hệ kín, song ta có thể thấy đây là điều kiện khá chặt. Bởi vậy để nới lỏng khả năng ứng dụng cho nó, luận án đã đưa ra thêm một phát biểu bổ sung như sau. * Định lý 3.4: Nếu bộ điều khiển dự báo phản hồi trạng thái uxkk() làm hệ ổn định tiệm cận và hệ kín phản hồi trạng thái mô tả bởi: xfxufxuxfx==(, ) ,*/ () = () kkkkkkk+1 () có hàm f / ()x thỏa mãn điều kiện Lipschitz, thì hệ kín phản hồi đầu ra sử dụng trạng thái k quan sát được xxekkk=+, trong đó ek là sai lệch quan sát, sẽ ổn định ISS với miền hấp dẫn O là lân cận gốc, có kích thước cho bởi: d()O (e ), K ≤ γ ∞ γ ∈ trong đó e là ký hiệu chuẩn vô cùng của vector hàm và dd()OO= max(,),xy ∀∈ xy, có ∞ xy, d(,)xy là ký hiệu khoảng cách của hai phần tử xy, . CHƯƠNG 4: ĐIỀU KHIỂN DỰ BÁO PHẢN HỒI ĐẦU RA VỚI BỘ QUAN SÁT TRẠNG THÁI TỐI ƯU CHO HỆ SONG TUYẾN Phần lớn tính phi tuyến của các quá trình công nghiệp, khi được biểu diễn dưới dạng không liên tục, đều xấp xỉ về được một trong hai dạng sau: xxxxukkkkk+1 =+AB() () (4.1) hoặc: xuxuukkkkk+1 =+AB() () (4.2) Dựa trên các kết quả đóng góp của luận án ở chương 3, chương này sẽ phát triển thêm một số kết quả về điều khiển dự báo phản hồi đầu ra dựa trên bộ quan sát tối ưu cho riêng lớp hệ song tuyến mô tả bởi cả hai dạng (4.1) và (4.2), trong đó hàm mục tiêu xây dựng cho bộ điều khiển dự báo là những hàm có tham số biến đổi. 14 4.1 Điều khiển dự báo phản hồi trạng thái hệ song tuyến 4.1.1 Thiết kế bộ điều khiển dự báo phản hồi trạng thái cho hệ song tuyến với hàm mục tiêu có tham số biến đổi Để đơn giản về mặt ký hiệu, ta viết lại mô hình dự báo (4.2) thành: xxukkkkk+1 =+AB (4.3) trong đó Akk= A()x và Bkk= B()x . Ta sẽ sử dụng hàm mục tiêu dạng toàn phương có tham số biến đổi: N −1 TT T JQ=++∑ ()xxuuxki+++ ki ki ki +++ R ki ki kN + Q kN + x kN + (4.5) i=0 với Qki+ , iN=−0, 1, , 1 là các ma trận đối xứng bán xác định dương, Rki+ , iN=−0,1, , 1 và QkN+ là các ma trận đối xứng xác định dương được xem như là các tham số của hàm mục tiêu, thay đổi được theo k và i , tức là thay đổi dọc theo trục thời gian tkT= cùng với cửa sổ dự báo, a cũng như theo i trong từng cửa sổ dự báo. Ngoài ra, ma trận QkN+ trong hàm phạt cần được chọn phù hợp để đảm bảo được tính ổn định cho hệ kín. Định lý 4.1: Xét hệ song tuyến (4.1) với mô hình dự báo (4.3). Khi đó: a) Khi cửa sổ dự báo N là hữu hạn, nếu tồn tại N ma trận đối xứng xác định dương Li với iN=−1, ,1, 0 là nghiệm của các phương trình: TT T−1 T LQi=+ ki+AAAB ki +++ L i11 ki − ki +++ L i ki( R ki + + BBBA ki +++ L i 1 ki) ki +++ L i 1 ki (4.7) và ở bước đầu tiên có LQNkN= + , thì dãy giá trị tín hiệu điều khiển: uxki++==Ki i ki, 0,1, , N − 1 (4.8) với TT−1 KRi=−() ki+++++++ +BBBA ki L i11 ki ki L i ki (4.9) sẽ làm cho hàm mục tiêu (4.5) đạt giá trị nhỏ nhất. b) Khi cửa sổ dự báo là vô hạn, tức là N = ∞ và QkN+ = Θ , nếu tồn tại ma trận đối xứng xác định dương Li là nghiệm của phương trình: −1 LQ=+ABTTT LI⎡⎤ − R + BBBA L L (4.10) iiki++ ki⎣⎦⎢⎥ ki +++++() ki ki i ki ki i ki+ thì dãy giá trị tín hiệu điều khiển: uxki++=≥Ki i ki, 0 (4.11) với TT−1 KRikikiikikiiki=−()+++ +BB L BA ++ L (4.12) sẽ làm cho hàm mục tiêu (4.5) đạt giá trị nhỏ nhất. Từ định lý 4.1, luận án đi đến bộ điều khiển dự báo phản hồi trạng thái cho hệ song tuyến làm việc theo các bước của thuật toán sau. Thuật toán 4.1: (Điều khiển dự báo phản hồi trạng thái khi không có điều kiện ràng buộc) 1) Gán k = 0 . 2) Cập nhật trạng thái xk . TT−1 3) Giải phương trình (4.10) với i = 0 và tính KRL000=−( kk +BB k) BA k L k. 4) Thực thi uxkk= K0 cho đối tượng rồi gán kk:1= + và quay lại bước 2. 15 4.1.2 Tính ổn định của hệ điều khiển dự báo phản hồi trạng th
File đính kèm:
- luan_an_dieu_khien_du_bao_phan_hoi_dau_ra_theo_nguyen_ly_tac.pdf