Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương

Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương trang 1

Trang 1

Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương trang 2

Trang 2

Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương trang 3

Trang 3

Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương trang 4

Trang 4

Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương trang 5

Trang 5

Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương trang 6

Trang 6

Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương trang 7

Trang 7

Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương trang 8

Trang 8

Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương trang 9

Trang 9

Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 27 trang nguyenduy 22/05/2024 1120
Bạn đang xem 10 trang mẫu của tài liệu "Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

Tóm tắt nội dung tài liệu: Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương

Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương
vực. Sau 
đây là một số mô hình số trị toàn cầu và khu vực đã được 
nghiên cứu, phát triển ở trong và ngoài nước. 
1.3.1. Một số mô hình số trị toàn cầu 
 Mô hình dự báo các trường số trị toàn cầu RHMC [95] do 
cơ quan Khí tượng Thuỷ văn Liên bang Nga xây dựng và đưa 
vào dự báo nghiệp vụ với các hạn dự báo cách nhau 6h một lần 
từ 12h đến 240h (10 ngày). Mô hình có ký hiệu T85L31. 
 Mô hình GME [53] (Global Model for Europe) được Cơ quan 
Khí tượng Cộng hòa Liên bang Đức (DWD) đưa vào dự báo 
nghiệp vụ từ cuối năm 1999 (độ phân giải khoảng 60 km). GME 
là mô hình được xây dựng cho 06 biến là nhiệt độ, khí áp, hơi 
nước, nước lỏng trong mây và hai thành phần gió ngang. 
 Mô hình AVN của Trung tâm Quốc gia Dự báo Môi trường 
Mỹ (National Centers for Environmental Prediction - NCEP) 
[92] là mô hình phổ dự báo hạn ngắn toàn cầu. Mô hình dự báo 
hạn vừa MRF (Medium Range Forecast Model) của NCEP 
 - 5 - 
(Mỹ) là mô hình phổ sử dụng hệ toạ độ theo phương thẳng 
đứng. Đây là một trong những mô hình dự báo với hạn dự báo 
lớn hơn 48h đầu tiên trên thế giới. Mô hình MRF có độ phân 
giải ngang khoảng 150 km và đã được đưa vào dự báo nghiệp 
vụ tại Mỹ từ năm 1995. Hiện nay, NCEP thực hiện dự báo hạn 
vừa và dài (đến 384h hay 16 ngày) bằng mô hình MRF. 
 Mô hình GFS (Global Forecasting System) [92] cũng của 
NCEP là mô hình phổ toàn cầu, bắt đầu được đưa vào sử dụng 
nghiệp vụ tại Trung tâm Khí tượng quốc gia NMC (National 
Meteorological Centre), tiền thân của NCEP từ năm 1988. 
 Mô hình GSM (Global Spectral Model) [93] là mô hình phổ 
toàn cầu của Cơ quan Khí tượng Nhật Bản (JMA). GSM bắt 
đầu được đưa vào sử dụng nghiệp vụ tại JMA từ năm 1988. 
1.3.2. Mô hình số trị khu vực 
a. Mô hình ETA [59, 66] 
 Mô hình khu vực hạn chế ETA do Trường Đại học Belgrade 
và Viện Khí tượng Thuỷ văn Belgrade cùng với Trung tâm Khí 
tượng quốc tế Mỹ xây dựng và được áp dụng cho đối tượng đặc 
biệt là khu vực có địa hình núi. 
b. Mô hình RAMS (Regional Atmospheric Modeling System) [67] 
 Phiên bản đầu tiên của mô hình RAMS ra đời vào năm 
1993, là kết quả kết hợp của hai mô hình có những tính chất 
giống nhau: mô hình mây quy mô vừa của Tripoli và Cotton và 
mô hình mây thuỷ tĩnh của Tremback. 
c. Mô hình HRM (High Resolution Regional Model) [90] 
 HRM là một mô hình số thuỷ tĩnh cho dự báo thời tiết khu 
vực hạn chế quy mô vừa, sử dụng hệ phương trình bao gồm 
nhiều đối tượng vật lý như: bức xạ, mô hình đất, các quá trình 
rối trong lớp biên, tạo mưa theo lưới, đối lưu nông/sâu,... 
d. Mô hình WRF (Weather Research and Forecasting) [97] 
 Mô hình WRF được hình thành bởi Trung tâm quốc gia 
Nghiên cứu Khí quyển Mỹ (National Center of Atmospheric 
Research-NCAR) với đóng góp của nhiều cơ quan khí tượng và 
đại học ở Hoa Kỳ cũng như trên thế giới. 
 - 6 - 
e. Mô hình MM5 [94] 
 Mô hình khí tượng động lực quy mô vừa MM5 là một trong 
những mô hình thế hệ mới của NCAR và Trường Đại học Tổng 
hợp Pennsylvania Mỹ (PSU). MM5 đang được nhiều cơ quan 
chính phủ (như Nha Khí Tượng Hoa Kỳ và NASA) cũng như 
nhiều trường đại học danh tiếng ở Hoa Kỳ và các quốc gia khác 
trên thế giới như tại Âu Châu, Hồng Kông và Đài Loan dùng 
để làm dự báo thời tiết. 
1.4. Các mô hình dự báo khí tượng được ứng dụng ở Việt Nam 
 Qua nghiên cứu và tìm hiểu, hiện nay 100% các mô hình dự 
báo thời tiết đang nghiên cứu và khai thác ứng dụng tại Việt 
Nam đều được nhập ngoại, chủ yếu là sử dụng các mô hình số 
trị khu vực như đã tóm tắt ở trên. 
1.5. Một số mô hình dự báo thông số khí tượng dùng mạng nơ rôn 
 Mạng nơ-rôn nhân tạo (Artificial Neural Networks-ANN) là 
một trong những công cụ mô hình hóa phi tuyến được sử dụng 
phổ biến hiện nay do nhiều ưu điểm nổi bật như: có thuật toán 
học để điều chỉnh tự động các thông số của mạng để giảm sai 
số trên bộ số liệu mẫu, có thể lựa chọn cấu trúc đơn giản hoặc 
phức tạp để phù hợp với đối tượng mô phỏng [38,48,51,60,75]. 
Có nhiều dạng mạng đã được đề xuất và ứng dụng như mạng 
MLP (Multi Layer Perceptron), mạng Hopfield, mạng Elman, 
mạng RBF (Radial Basis Function), mạng lô-gic mờ [49,50, 
63,77,78]... Gần đây là các mạng Deep Learning [57]. Các ứng 
dụng trong mô hình phi tuyến nói chung và trong các bài toán 
dự báo thông số thời tiết, khí tượng, môi trường của các mạng 
nói riêng cũng rất phong phú. 
 Nội dung chương I đề cập tới 2 nhóm giải pháp: một là 
nhóm các giải pháp thương mại đang được sử dụng trong thực 
tế, hai là nhóm các giải pháp (đang ở mức độ nghiên cứu, mô 
phỏng) được giới thiệu trong các tài liệu tham khảo. Đối với 
các giải pháp thương mại, do đều là các phần mềm mã nguồn 
đóng nên không có đầy đủ các thông tin về giải pháp ứng dụng 
bên trong. Nhược điểm chung của các giải pháp này là yêu cầu 
 - 7 - 
cao về thông số đầu vào và hạ tầng tính toán, giá thành đắt, khó 
chủ động cập nhật hay điều chỉnh theo yêu cầu của địa phương. 
Đối với các giải pháp tổng hợp từ các bài báo khoa học, NCS 
đã tìm hiểu và trình bày nhiều hơn về các mô hình toán học 
cũng như một số thông số được các tác giả đưa ra. Tuy nhiên 
khó khăn chung khi so sánh đó là mỗi mô hình được sử dụng 
cho các địa điểm khác nhau, thông số đầu vào và đầu ra cũng 
khác nhau. Vì vậy các so sánh mới dừng ở mức độ nhất định. 
1.6. Đề xuất của luận án 
 Hiện nay, việc áp dụng các mô hình dự báo thông số khí 
tượng tiên tiến hiện nay không phù hợp với điều kiện ở Hải 
Dương do: 
 − Kinh phí thu thập số liệu quá lớn. 
 − Hạ tầng máy tính và công nghệ thông tin không đáp ứng. 
 − Không chủ động về công nghệ nên khó điều chỉnh các 
thông số của mô hình cho phù hợp với tỉnh Hải Dương. 
 Để khắc phục những tồn tại trên luận án đề xuất giải pháp 
thực hiện các nhiệm vụ sau: 
 − Dự báo thông số khí tượng cho nhiều địa điểm; 
 − Thu thập số liệu không quá phức tạp; 
 − Hạ tầng máy tính không cần quá cao; 
 − Xây dựng các mô hình ước lượng và dự báo phù hợp với 
thực tế tại Hải Dương. 
Chương 2: MÔ HÌNH LAI VÀ ỨNG DỤNG TRONG CÁC 
 VẤN ĐỀ MÔ HÌNH HÓA PHI TUYẾN 
2.1. Giới thiệu chung 
 Đã có nhiều công trình nghiên cứu chứng minh rằng công cụ 
mạng véc-tơ hỗ trợ SVM (Support Vector Machines) có khả 
năng tốt hơn không chỉ trong các bài toán nhận dạng và phân 
loại các mẫu rời rạc mà còn trong cả các bài toán ước lượng 
các hàm phi tuyến [70, 76, 85]. Trong luận án này NCS đề xuất 
tiếp tục cải thiện chất lượng sử dụng của SVM bằng việc tách 
 - 8 - 
riêng thành phần tuyến tính, chỉ dùng SVM làm công cụ ước 
lượng thành phần phi tuyến trong một mô hình lai [5]. Các kết 
quả tính toán và mô phỏng cho thấy mô hình lai sử dụng SVM 
cho kết quả tốt hơn mô hình lai sử dụng mạng MLP, tốt hơn 
khi sử dụng riêng lẻ SVM và cũng tốt hơn một số mô hình dự 
báo thông số khí tượng kinh điển. 
2.2. Mô hình lai và ứng dụng trong mô hình phi tuyến 
2.2.1. Mục đích sử dụng mô hình lai 
 Mục đích của việc sử dụng mô hình lai là tách riêng thành 
phần tuyến tính để giảm bớt mức độ phức tạp của mô hình phi 
tuyến. Khi mô hình phi tuyến có số tham số ít hơn thì các thuật 
toán tối ưu hóa sẽ có khối lượng tính toán giảm và xác suất đạt 
được nghiệm cực trị tốt hơn sẽ cao. Đồng thời các thành phần 
tuyến tính được tối ưu hóa bằng các thuật toán chuyên biệt 
cũng sẽ đạt được cực trị (toàn cục) nhanh và chính xác hơn khi 
tối ưu hóa bằng các thuật toán chuyên dùng cho hàm phi tuyến. 
2.2.2. Mô tả toán học của mô hình lai 
 Với véc-tơ đầu vào xác định x ta có đáp ứng đầu ra của hệ 
lai là tổng đáp ứng của khối tuyến tính và khối phi tuyến: 
 d= f(x) Linear( x) + NonLinear ( x) (2.1) 
2.3. Phương pháp xây dựng mô hình lai từ các bộ số liệu mẫu 
 Quy trình thực hiện gồm các bước như sau: 
2.3.1. Bộ số liệu đầu vào 
 Đối với bài toán dự báo, hàm truyền đạt phi tuyến tổng quát 
có dạng: yf(d )= (x ( d− 1),,, x ( d − 2) x ( d − K ) ) (2.2) 
trong đó x(d− 1) là véc-tơ đầu vào các đại lượng đo ở ngày thứ 
d −1, y()d là đại lượng cần dự báo ở ngày d, (dK−−) ngày 
xa nhất sử dụng trong dự báo. Do đó một mẫu số liệu gồm cặp 
 (d−− 1) ( d K ) ( d )
 xx,,; y  và được lấy cho nhiều ngày d. 
 Đối với bài toán ước lượng, hàm truyền đạt phi tuyến tổng 
 - 9 - 
 ()()()()d d d d
quát có dạng: y= f( x12,,, x xN ) (2.3) 
 ()d ()d
trong đó xi là đại lượng đo tại vị trí i ở ngày thứ d, y là 
đại lượng cần ước lượng ở ngày thứ (d ) ở vị trí khác các xi. 
 ()()()d d d
Một mẫu số liệu sẽ bao gồm một cặp x1 ,,; xN y  và 
được lấy liên tiếp cho nhiều ngày d. 
2.3.2. Lựa chọn đầu vào 
 Có nhiều phương pháp khác nhau để lựa chọn đầu vào cho mô 
hình dự báo [47, 74]. Trong số đó, các phương pháp phổ biến 
được sử dụng là phương pháp phân tích theo các thành phần 
chính, phương pháp sử dụng hàm tương quan, sử dụng hệ số khai 
triển tuyến tính, [9, 43]. Luận án thử nghiệm trên cùng bộ số 
liệu để đánh giá 03 phương pháp trên khi sử dụng với mô hình lai 
và lựa chọn phương pháp cho kết quả sai số nhỏ nhất. 
2.3.3. Xây dựng khối tuyến tính 
 Mô hình tuyến tính được xác định trên cơ sở tìm các hệ số 
a j sao cho hàm sai số E trong (2.4) đạt giá trị nhỏ nhất trên tập 
mẫu số liệu [5]: 
 p
 1 2
 E= Linear(xdii ) − → min (2.4) 
 2 i=1
2.3.4. Xây dựng khối phi tuyến 
 Sau khi có mô hình tuyến tính, phần sai số còn lại sẽ được 
xấp xỉ bởi mô hình phi tuyến sao cho: 
 p
 1 2
E= NonLinear(xi ) − ( d i − Linear ( x i )) → min (2.5) 
 2 i=1
 Trong luận án, mô hình phi tuyến sẽ sử dụng mạng SVM. 
2.4. Ưng dụng SVM xây dựng hàm truyền phi tuyến 
2.4.1. Giới thiệu chung 
 Mục tiêu nghiên cứu là xây dựng mô hình dự báo và mô 
hình ước lượng nội suy đều là dạng hàm biến thiên liên tục nên 
 - 10 - 
luận án sẽ sử dụng mô hình SVR. Nhiều ý tưởng của SVR xuất 
phát từ các công thức gốc của SVM nên luận án sẽ trình bày 
tóm tắt về các công thức này trước khi giới thiệu về SVR. 
2.4.2. Bài toán phân lớp nhị phân 
 Bài toán phân lớp nhị phân [85] này được phát biểu như sau: 
Cho tập dữ liệu gồm p mẫu huấn luyện xii,d , ip=1,2, , , 
 N
trong đó xi và di 1 là đầu ra rời rạc có thể nhận 1 
trong 2 giá trị đại diện cho hai nhóm số liệu. Tìm một siêu 
phẳng wxT  +b = 0 để tách tập dữ liệu thành 2 lớp sao cho: 
 T T
wxii +by 11 → = ; wxii +by −11 → = − . 
 Do có thể tồn tại nhiều mặt phẳng phân cách, nên để có thể 
có nghiệm xác định duy nhất, ta bổ sung thêm điều kiện tổng 
khoảng cách từ các điểm gần nhất của hai nhóm tới mặt phân 
cách (còn gọi là các véc-tơ hỗ trợ) là lớn nhất [85]. 
2.4.3. Kỹ thuật SVR (Support Vector Regression) 
 Phát triển tiếp các ý tưởng của SVM dùng trong các bài toán 
phân loại, khi các giá trị đầu ra là các mã phân lớp (là các giá 
trị rời rạc), SVM được mở rộng để sử dụng trong các bài toán 
ước lượng bằng cách sử dụng một hàm tổn thất (lost function). 
Lúc này, kỹ thuật SVM được gọi là máy véc-tơ đỡ ước lượng 
(SVR – Support Vector Regression). 
2.4.4. Phương pháp LS-SVM 
 Phương pháp LS-SVM đã được cải tiến dựa trên kỹ thuật 
SVR [23]. Xét bộ dữ liệu học gồm p điểm x , y p với dữ 
 kkk=1
 N
liệu đầu vào xk và đầu ra yk . 
 Trong không gian đặc trưng, phương pháp LS-SVM có 
dạng: 
 yb(x) =+ wT ( x) (2.6) 
 Các thông số của mô hình được xác định bằng việc tối ưu 
hóa hàm giá trị phạt: 
 - 11 - 
 p
 11T 2
 Minimize: ww+  ek (2.7) 
 22k=1
 T
với ek= y(x k) − w  ( x k ) + b, k = 1,2, , p là sai số và 
 − thông số điều chỉnh. Bài toán ước lượng sẽ được chuyển 
thành dạng phi tuyến khi sử dụng hàm nhân K (xx, k ) như sau: 
 p
 y(x) = kk  K( x, x ) + b (2.8) 
 k=1
 Hàm cơ sở xuyên tâm (RBF) trong LS-SVM được sử dụng 
như hàm nhân với công thức như sau: 
 T
 (xk− x l) ( x k − x l )
 (2.67) 
 K(xxkl,) = exp  −2 , k = 1,..., p
  2
trong đó  là độ rộng của hàm RBF. 
2.5. Ví dụ ứng dụng minh họa 
 Trình bày ví dụ kiểm chứng khả năng ứng dụng của SVM 
trong bài toán ước lượng hàm phi tuyến cũng như khả năng của 
mô hình lai khi dùng SVM và mô hình dùng SVM trực tiếp. 
2.6. Kết luận chương 2 
 Luận án đã đề xuất sử dụng SVM để ước lượng khối phi 
tuyến trong mô hình lai, cải thiện được độ chính xác hơn so với 
mô hình lai dùng mạng MLP sử dụng trong [5]. 
 Để so sánh tính ưu việt của mô hình lai trong bài toán ước 
lượng hàm phi tuyến, luận án đã tiến hành thực nghiệm, kết 
quả mô hình lai sử dụng SVM cho sai số tốt hơn khi sử dụng 
trực tiếp mạng SVM đây là cơ sở để luận án đề xuất sử dụng 
mô hình lai để ước lượng, dự báo thông số khí tượng. 
 - 12 - 
Chương 3: XÂY DỰNG CÁC GIẢI PHÁP DỰ BÁO, ƯỚC 
 LƯỢNG XỬ DỤNG MÔ HÌNH LAI 
3.1. Đặt vấn đề 
 Luận án tiến hành xây dựng hai giải pháp dự báo thông số 
khí tượng tại một điểm dựa trên các số liệu đo quá khứ (còn gọi 
tắt là bài toán dự báo), ước lượng thông số khí tượng tại một vị 
trí dựa trên các số liệu đo tại các điểm lân cận (còn gọi tắt là 
bài toán ước lượng). Cả hai giải pháp này sẽ sử dụng mô hình 
lai cho phần ước lượng hàm truyền đạt phi tuyến. 
3.2. Xây dựng mô hình lai cho bài toán dự báo 
3.2.1. Lựa chọn đầu vào 
 Trích chọn đặc tính đầu vào là một bước rất quan trọng 
trong quá trình nhận dạng, điều khiển tín hiệu hay dự báo 
sau khi được thu thập bằng cách loại bỏ những thông tin đặc 
trưng có rất ít hoặc không có thông tin dự đoán. 
3.2.2. Xác định các hệ số của khối tuyến tính 
 Từ phương trình (2.8), giả thiết ta có một tập hợp N thông 
số TTT12,,, N  được đo trong một thời gian, mỗi thông số có 
được p mẫu: TTTi12,,, i ip (iN=1, , ) . Các mô hình dự 
báo sẽ được xây dựng độc lập cho từng thông số, mỗi mô hình 
sẽ có một đầu ra tương ứng với giá trị của thông số của ngày 
tiếp theo. Tuy nhiên các đầu vào được sử dụng cho từng mô 
hình sẽ được xác định độc lập (và danh sách đầu vào cũng sẽ 
khác nhau cho từng mô hình). Trước tiên thành phần quan hệ 
tuyến tính giữa thông số Ti của ngày d với chính thông số Ti 
đó của các ngày quá khứ được biểu diễn và xác định từ hệ 
phương trình ước lượng xấp xỉ như trong công thức (3.1) và 
 T
(3.2). Từ (3.2) ta cần xác định véc-tơ a = a12,,, a aK  để đạt 
cực tiểu của hàm sai số ước lượng. Trong thực tế áp dụng, ta 
xác định xem các đầu vào cho mô hình dự báo sẽ là các số liệu 
 - 13 - 
gì trong quá khứ: 
 Ti( d− 1) T i ( d − 2) T i ( d − K ) a1 Tdi ()
 Ti( d− 2) T i ( d − 3) T i ( d − K − 1) a2 Tdi (− 1) 
 = 
 Ti( d− p ) T i ( d − p − 1) T i ( d − p − K − 1) aK Ti ( d−+ p 1)
 (3.1) 
 Trước tiên danh sách các đầu vào quá khứ sẽ được tìm kiếm 
theo ý tưởng đã được trình bày ở Chương 2 trong một khoảng 
thời gian đủ xa (Luận án chọn K=60 - tương đương 2 tháng 
trong quá khứ) để thử nghiệm. 
 Ví dụ, nếu sử dụng phương pháp đánh giá theo hệ số khai 
triển tuyến tính, ta sẽ xét với K đầu vào quá khứ với bộ số liệu 
 T
nhiều mẫu đã có, ta xác định véc-tơ a = aa1,,K  của hàm 
 p
ước lượng tuyến tính T() d a  T d − j bằng 
 i j=1 j i ( )
phương pháp khai triển ma trận dùng SVD. Tiếp theo xác định 
thành phần có giá trị tuyệt đối nhỏ nhất trong véc-tơ a. Thành 
phần này sẽ tương ứng với ngày trong quá khứ có ảnh hưởng ít 
nhất tới ngày dự báo tiếp theo. Ta loại bỏ ngày này khỏi bộ số 
liệu trong quá khứ, giảm K=K-1, và quay lại bước 2 nếu K > 
Kmin chọn trước. Quá trình lặp các bước 2-3 sẽ được tiếp tục 
cho đến khi K giảm xuống một giá trị đủ nhỏ có thể chấp nhận 
được để mô hình không quá phức tạp, khó sử dụng trong thực 
tế. Cụ thể trong luận án ta chọn Kmin<5. 
 Tương tự như vậy, ta xây dựng hàm quan hệ tuyến tính giữa 
Ti của ngày d với các thông số Tk khác (k= 1, , N ; k i) của 
các ngày trong quá khứ ta được phương trình như trong công 
thức sau:Ti( d)  a j1  T i( d − j) +   a jk  T k ( d − j) 
 j k i j
 Sau khi đã xác định được mối quan hệ tuyến tính giữa Tdi () 
của ngày d với các ngày trong quá khứ, ta tính sai số lệch giữa 
 - 14 - 
số liệu thực tế và số liệu ước lượng trong phương trình: 
  
 NLdTd()=i( ) −  aTdj j1  i( −) +   aTdj jk  k ( − ) 
  j k i j
 (3.2) 
được coi là phần phụ thuộc phi tuyến còn lại giữa Ti với các 
đầu vào và sẽ là giá trị đích mà khối phi tuyến cần tạo ra. 
3.2.3. Xây dựng khối phi tuyến của mô hình lai 
 Sau khi đã xác định được các thông số mô hình tuyến tính, 
ta tiến hành xây dựng mô hình phi tuyến để ước lượng thành 
phần phi tuyến còn lại (phương trình 3.2). 
3.3. Xây dựng mô hình lai cho bài toán ước lượng 
3.3.1. Bài toán ước lượng thông số khí tượng 
 Giả thiết rằng ta có kết quả đo các thông số khí tượng dựa 
kết quả đo quan trắc ở các điểm A1, A2,, AN. Mục tiêu đặt ra 
là ta cần ước lượng thông số khí tượng tại điểm B (vị trí không 
có trạm quan trắc), khi đó ta cần xây dựng hàm quan hệ (thông 
thường đây là quan hệ phi tuyến) giữa thông số khí tượng tại 
điểm B và tại các điểm Ai có dạng tổng quát như sau: 
 TBd( ,,,,,,,) = gTAdTAd( ( 12) ( ) TAd( N )) (3.3) 
trong đó T - thông số khí tượng cần ước lượng, d – ngày đang 
xét; hàm g() là phi tuyến (cần xây dựng). Hàm phi tuyến g() sẽ 
được sử dụng mô hình lai để ước lượng. Mô hình (3.3) cũng có 
thể được sử dụng để bù dữ liệu khuyết thiếu tại điểm B. Ngoài 
ra, mô hình (3.3) có thể đực phát triển phát triển cho việc ước 
lượng thông số T khác (ví dụ để ước lượng Tmax có thể dùng 
RHmax của điểm lân cận,...). 
 Từ (3.3) ta ước lượng thông số khí tượng tại 02 địa điểm 
(thành phố Hải Dương, thị xã Chí Linh) dựa trên kết quả đo 
của 05 trạm quan trắc lân cận. 
THDd,,,,,,,,,, gTTBd TBNd TQNd THPd THYd
 (3.4a) 
 - 15 - 
và 
TCLd,,,,,,,,,, gTTBd TBNd TQNd THPd THYd
 (3.4b) 
 Từ bộ số liệu đã có, luận án sẽ xây dựng bốn mô hình ước 
lượng cho bốn thông số là Tmax, Tmin, RHmax và RHmin. 
3.3.2. Xác định các thông số đầu vào cho mô hình ước lượng 
 Thực hiện tính toán mô phỏng với các bộ đầu vào khác nhau 
cho cùng một địa điểm (ở đây là thành phố Hải Dương hoặc thị 
xã Chí Linh) và cùng một thông số khí tượng (nhiệt độ lớn 
nhất, nhỏ nhất trong ngày, độ ẩm lớn nhất, nhỏ nhất trong 
ngày) để xác định xem cần sử dụng thông tin từ các địa điểm 
lân cận nào để đạt kết quả chính xác nhất. 
3.4. Kết luận chương 3 
 − Xây dựng mô hình lai cho bài toán dự báo: phân tích, lựa 
chọn các đặc tính đầu vào cho mô hình, xây dựng mô hình xác 
định thành phần tuyến tính và phi tuyến. 
 − Xây dựng mô hình lai cho bài toàn ước lượng: xây dựng 
các kịch bản cho bài toán ước lượng thông số khí tượng dựa 
trên kết quả đo của các trạm quan trắc lân cận. 
Chương 4: CÁC KẾT QUẢ TÍNH TOÁN VÀ MÔ PHỎNG 
4.1. Đặt vấn đề 
 Với quy trình xây dựng mô hình như ở chương 3, tiến hành 
tính toán thực nghiệm trên bộ số liệu do Đài Khí tượng thủy 
văn và Biến đổi khí hậu khu vực đồng bằng Bắc Bộ cung cấp. 
4.2. Đánh giá, lựa chọn đặc tính đầu vào cho các mô hình 
 Thực nghiệm với 3 phương pháp khác nhau gồm PCA, hàm 
tương quan, khai triển theo hệ số tuyến tính trên cùng bộ số 
liệu đầu vào. Kết quả thực nghiệm phương pháp khai triển theo 
hệ số tuyến tính cho sai số nhỏ nhất và được chọn để xác định 
thành phần tuyến tính trong mô hình lai. 
 - 16 - 
 4.3. Kết quả dự báo, ước lượng thông số khí tượng theo 
chuỗi thời gian 
4.3.1. Kết quả xây dựng mô hình lai dự báo thông số khí tượng theo 
chuỗi thời gian 
a. Lựa chọn đặc tính đầu vào cho các mô hình dự báo và xác 
định thành phần tuyến tính 
 Sử dụng phương pháp khai triển theo hệ số tuyến tính xác 
định thành phần tuyến tính trong mô hình lai. Kết quả sau khi 
trích chọn đặc tính ta có số liệu các ngày quá khứ ảnh hưởng 
đến ngày dự báo d+1: Tmax (19 đầu vào), Tmin (18 đầu vào), 
RHmax (22 đầu vào), RHmin (19 đầu vào). 
b. Xác định thành phần phi tuyến 
 Sai số còn lại sau khi ước lượng thành phần tuyến tính chính 
là giá trị đích cần đạt được của khối phi tuyến. Sử dụng các mô 
hình mạng nơ-rôn khác nhau để huấn luyện mô hình mạng như: 
MLP, MLR, RBF, Elman, BTree, SVM và đánh giá, so sánh 
kết quả sai số. Kết quả SVM cho kết quả sai số tuyệt đối trung 
bình nhỏ nhất và được chọn là mạng nơ-rôn để xác định thành 
phần phi tuyến. 
 Hình 4.1 là sai số học và kiểm tra khi xác 

File đính kèm:

  • pdfluan_an_xay_dung_mo_hinh_du_bao_mot_so_thong_so_khi_tuong_ch.pdf