Luận án Nghiên cứu phương pháp xác định vị trí sự cố trên đường dây tải điện dựa trên mạng nơron MLP

Download
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
132 trang nguyenduy 26/07/2024 4530
Download
Bạn đang xem 10 trang mẫu của tài liệu "Luận án Nghiên cứu phương pháp xác định vị trí sự cố trên đường dây tải điện dựa trên mạng nơron MLP", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.
Tóm tắt nội dung tài liệu: Luận án Nghiên cứu phương pháp xác định vị trí sự cố trên đường dây tải điện dựa trên mạng nơron MLP

định nghĩa đƣợc hàm 
Sóng Mẹ (Mother wavelet) hay còn gọi là hàm Sinh của họ wavelet đang xét: 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 34 - 
0 0
( ) 2 ( 1) (2 ) 2 (2 )
N N
k
N k k
k k
x h x k g x k   
   (3.4) 
trong đó các hệ số ( 1)kk N kg h sẽ tƣơng ứng với một bộ lọc thông cao (hay còn gọi là 
bộ lọc thông cao trong quá trình phân tích HD - High pass filter for Decomposition). 
Hình 3.9: Hàm co dãn (trên) và hàm sinh (dưới) của wavelet Haar 
Lấy ví dụ một trong những wavelet cơ bản và đơn giản nhất là wavelet Haar (cũng 
đồng thời là wavelet bậc 1 trong họ các wavelet Daubechies). Wavelet Haar có hàm 
scaling cho theo định nghĩa: 
1 0 1
0
x

 ngîc l¹i
 (3.5) 
Khi đó có thể dễ dàng chứng minh đƣợc rằng: 
 ( ) (2 ) (2 1)x x x   (3.6) 
Từ đó biểu diễn lại hàm Scaling: 
  
1 1 1 1
( ) 2 (2 ) (2 1) ,
2 2 2 2
x x x  
h (3.7) 
Suy ra hàm sinh của wavelet Haar: 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 35 - 
  
1 1 1 1
( ) 2 (2 ) (2 1) ,
2 2 2 2
x x x  
g (3.8) 
Hai hàm trên đƣợc mô tả trên hình 3.9. Một số các họ wavelet khác đƣợc biểu diễn 
hàm sinh trên hình 3.10. 
Hình 3.10: Một số wavelet kinh điển 
Khi sử dụng một họ wavelet, một tín hiệu hàm thời gian có thể đƣợc phân tích theo 
cấu trúc nhƣ trên hình 3.11 nhƣ sau: 
 ( ) ( ) ( )f t a t d t (3.9) 
với a đƣợc gọi là thành phần "xấp xỉ" (approximation) chứa các thành phần biến thiên 
chậm trong f(x) và d đƣợc gọi là thành phần "chi tiết" (detail) chứa các thành phần biến 
thiên nhanh. Tiếp tục quá trình phân tích tƣơng tự cho thành phần a để có đƣợc kết quả 
phân tích phổ wavelet đa tầng: 
1 1
1 2 2
1 1
( ) ( ) ( )
( ) ( ) ( )
...
( ) ( ) ( )k k k
f t a t d t
a t a t d t
a t a t d t 
 (3.10) 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 36 - 
Hình 3.11: Cấu trúc các bước liên tiếp phân tích một tín hiệu ban đầu thành các thành phần chi 
tiết và xấp xỉ 
Để lấy ví dụ về quá trình phân tích này, sẽ ứng dụng họ wavelet Daubechies bậc 4 để 
phân tích tín hiệu tuần hoàn cho theo công thức (3.2). Kết quả đƣợc thể hiện trên hình 3.12. 
Hình 3.12: Kết quả phân tích tín hiệu tuần hoàn theo họ wavelet Daubechies bậc 4 (trên cùng bên 
trái: tín hiệu gốc, các cửa sổ còn lại: các thành phần tách ra được) 
Từ các kết quả phân tích có thể nhận thấy thành phần tần số nhanh nhất đƣợc chứa 
trong 1d , các thành phần biến thiên chậm nhất đƣợc chứa trong 4 ,a và 4d . Do đó thành 
(s) 
(s) 
(s) 
(s) 
(s) 
(s) 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 37 - 
phần 2sin 2 2t  đƣợc chứa trong 4 ,a thành phần 0,5 sin 2 10t   chứa trong 4d và 
thành phần sin 2 20t  chứa trong 3d . Một phần đáng kể của thành phần 40Hz cũng 
đƣợc chứa trong 2d do các thành phần 3d và 4d không phải là sin() hoàn hảo nhƣ trong 
tín hiệu gốc. Cũng có thể nhận thấy thành phần 1d rất nhỏ (coi nhƣ bằng 0 so với các 
thành phần khác) chứng tỏ rằng tín hiệu ban đầu không có chứa các hài bậc cao. 
Khi phân tích tín hiệu bất định cho theo công thức (3.3), sẽ thu đƣợc kết quả nhƣ trên 
hình 3.13. Có thể nhận thấy rằng ba thành phần cơ bản đã đƣợc xác định rất chính xác. 
Thành phần 2sin 2 2t  nằm trong 4 ,a thành phần 0,5 sin 2 10t   nằm trong 4d 
và thành phần sin 2 20t  nằm trong cả 2d và 3.d Đồng thời các thời điểm thay đổi 
của tín hiệu cũng đƣợc thể hiện rất rõ ràng bằng các thay đổi trong biên độ tín hiệu của 4 ,a 
2d và 1.d Có thể thấy đối với tín hiệu bất định thì khả năng phát hiện các thành phần tần 
số và đặc biệt là khả năng phát hiện các thời điểm xảy ra thay đổi đột ngột trong tín hiệu 
của wavelet là vƣợt trội hơn so với công cụ phân tích phổ Fourier. 
Hình 3.13: Kết quả phân tích tín hiệu bất định bằng họ wavelet Daubechies 4 (phía trên bên trái: 
tín hiệu gốc, các hình còn lại: các thành phần tách ra được từ tín hiệu ban đầu) 
(s) 
(s) 
(s) 
(s) 
(s) 
(s) 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 38 - 
Sau đây là một ví dụ tiếp theo về khả năng phát hiện các thay đổi trong tín hiệu bằng 
việc sử dụng wavelet. Trên hình 3.14 là một tín hiệu hình sin() đƣợc lấy mẫu với chu kỳ 
0 0,02sT trong thời gian 3s (tƣơng ứng với 150 mẫu). 
( ) sin( )y t t với 0;0,02;0,04;...;3.t 
Tín hiệu này đƣợc phân tích theo wavelet Haar thành 4 bậc. 
Hình 3.14: Phân tích phổ của tín hiệu hình sin() không có nhiễu 
Sau đó gây nhiễu cho tín hiệu bằng cách tăng biên độ của tín hiệu lên 1% tại thời 
điểm t=1,2s (tƣơng ứng với mẫu thứ 60). 
sin( ) 1,2s
( )
1,01sin( ) 1,2s
t khi t
y t
t khi t
 Có thể thấy rằng việc thay đổi biên độ 1% này gần nhƣ không thể quan sát đƣợc trên 
đƣờng biến thiên theo thời gian của tín hiệu nhƣ trên hình 3.15. Tuy nhiên, khi phân tích 
tín hiệu theo họ wavelet đơn giản nhất là wavelet Haar, có thể nhận thấy có sự khác biệt 
thể hiện rất rõ trong thành phần 1d - là thành phần chứa các hài cao nhất của tín hiệu ban 
đầu nhƣ trên hình 3.15 tại thời điểm 1,2s (tƣơng ứng với mẫu thứ 60 của cửa sổ tín hiệu). 
(s) 
(s) 
(s) 
(s) 
(s) 
(s) 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 39 - 
Hình 3.15: Phân tích phổ của tín hiệu hình sin có thay đổi 1% về biên độ tại thời điểm t=60 theo 4 
bậc wavelet Haar 
 Các kết quả hoàn toàn tƣơng tự có thể đƣợc thu nhận cho trƣờng hợp có thay đổi đột 
ngột về tần số. 
Trên hình 3.16 là các kết quả phân tích cho tín hiệu sin() ban đầu nhƣng tại thời điểm 
t=1,2s tăng tần số của tín hiệu lên 2%: 
sin( ) 1,2s
( )
sin(1,02 ) 1,2s
t khi t
y t
t khi t
 
Một lần nữa có thể quan sát đƣợc sự khác biệt rất rõ ràng về biên độ của tín hiệu 
trong thành phần 1d khi so sánh với các kết quả trên hình 3.14 cũng tại thời điểm 1,2s (tại 
thời điểm thứ 60 của cửa sổ tín hiệu). 
(s) 
(s) 
(s) 
(s) 
(s) 
(s) 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 40 - 
Hình 3.16: Phân tích phổ của tín hiệu hình sin có thay đổi 2% về tần số tại thời điểm t=60 
3.3.3. Thuật toán phân tích tín hiệu bằng wavelet [96] 
Với mỗi họ wavelet ban đầu có véc-tơ độ dài N tƣơng ứng với hàm scaling đƣợc cho 
trƣớc  
1,...i i N
w
 W . Các hệ số của bộ lọc thông thấp của quá trình phân tích (véc-tơ 
LD) và của quá trình tổng hợp (véc-tơ LR - Low pass filter for Reconstruction) đƣợc xác 
định bởi: 
 2
1
( )
i i
i
i
i N i
W W
LR
norm W
LD LR 
W (3.11) 
Các hệ số của bộ lọc thông cao của quá trình phân tích (véc-tơ HD) và của quá trình 
tổng hợp (véc-tơ HR - High pass filter for Reconstruction) đƣợc xác định bởi: 
1
( 1)
( 1)
i
i i
i
i i
HD LR
HR LD 
 (3.12) 
Bƣớc phân tích đầu tiên của tín hiệu sử dụng hai bộ lọc [LD] và [HD] có đƣợc hai 
thành phần là thành phần xấp xỉ a (đƣợc đặc trƣng bởi các hệ số 1ca ) và thành phần chi 
tiết d (đƣợc đặc trƣng bởi các hệ số 1cd ) tính theo các công thức: 
(s) 
(s) 
(s) 
(s) 
(s) 
(s) 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 41 - 
1
1
2
2
ca f
cd f
 
 
LD
HD
 (3.13) 
với ' ' – toán tử nhân chập, 2 là toán tử giảm tần số lấy mẫu của tín hiệu đi 2 lần, có 
thể đơn giản định nghĩa theo: 
 2 ( ) (2 )u u u k u k    
Từ các hệ số 1ca và 1cd sẽ xác định đƣợc các thành phần 1a và 1d theo các công 
thức sau: 
1 1
1 1
2
2
ca
cd
  
  
a LR
d HR
 (3.14) 
với ' ' – toán tử nhân chập, 2 là toán tử tăng tần số lấy mẫu của tín hiệu lên 2 lần, có 
thể đơn giản định nghĩa theo: 
(2 1) 0
2
(2 ) ( )
u k
u u
u k u k
  



và các bộ lọc  LR và  HR là các bộ lọc tƣơng ứng cho quá trình tổng hợp cũng đã 
đƣợc xác định trong các công thức (3.11) và (3.12). 
Quá trình trên có thể đƣợc lặp lại với thành phần 1a để có đƣợc kết quả phân tích 
tầng thứ 2 của tín hiệu (nhƣ đƣợc thể hiện trên hình 3.11). 
Ví dụ tính toán minh họa cho wavelet Haar: 
Hàm scaling: 
1 1 1
; ( )
2 2 2
norm
W W 
Bộ lọc phân tích và tổng hợp thông thấp: 
 
 
1 1 1 1
, ,
2 2 2 2norm
W
LR LD
W
Bộ lọc phân tích và tổng hợp thông cao: 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 42 - 
 
  1
1 1
( 1) ,
2 2
1 1
( 1) ,
2 2
i
i
i
i
LR
LD 
HD
HR
Lấy ví dụ một véc-tơ đầu vào  1,2,3,4,5,3,2,1 x 
Khi đó có các hệ số của thành phần 1a bằng: 
  1 2 2,1213 4,9497 5,6569 2,1213ca  x LD 
Từ đó thành phần 1a sẽ bằng: 
 1 2 0 2,1213 0 4,9497 0 5,6569 0 2,1213ca  
  1 1 2 1,50 1,50 3,50 3,50 4,00 4,00 1,50 1,50ca  a LR 
Tƣơng tự, các hệ số của thành phần 1d bằng: 
  1 2 0,707 0,707 1,414 0,707cd  x HD 
 1 2 0 0,707 0 0,707 0 1,414 0 0,707cd  
  1 1 2 0,50 0,50 0,50 0,50 1,00 1,00 0,50 0,50cd  d HR 
Với ví dụ tính toán trên đây, có thể thấy biến đổi wavelet có thể đƣợc thực hiện thuận 
tiện và nhanh chóng, với khối lƣợng tính toán nhỏ hơn nhiều so với biến đổi phổ FFT. 
Phần tiếp theo sẽ trình bày về một công cụ khác đƣợc sử dụng trong luận án, đó là mô hình 
mạng nơron MLP và ứng dụng trong xây dựng các ánh xạ phi tuyến trên cơ sở một bộ mẫu 
số liệu cho trƣớc. 
3.4. Mạng nơron nhân tạo và ứng dụng xác định vị trí sự cố trên 
đƣờng dây tải điện 
3.4.1. Mô hình nơron nhân tạo của McCulloch - Pitts [12,69] 
3.4.1.1. Cơ sở toán học của mô hình 
Một trong những nghiên cứu đầu tiên đƣa ra đƣợc mô hình toán học cho nơron là của 
McCulloch và Pitts vào năm 1943. Theo đó ta có thể mô tả các nơron thần kinh của con 
ngƣời có cấu trúc đặc trƣng chung nhƣ sau: 
 Có nhiều tín hiệu đầu vào. 
 Mức độ phụ thuộc vào các tín hiệu đầu vào khác nhau. 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 43 - 
 Khi tổng các kích thích đầu vào vƣợt quá một ngƣỡng, nơron sẽ tạo ra một xung 
tín hiệu đầu ra. 
Từ đó có mô hình của nơron bao gồm 3 thành phần cơ bản: 
 Hệ thống các ghép nối thần kinh (synapses, connection links): đƣợc đặc trƣng bởi 
hệ số khuếch đại tín hiệu của mỗi ghép nối. Cụ thể khi có một tín hiệu xi đƣợc đƣa 
vào đầu ghép nối thứ j đến nơron thứ k thì khi đi qua ghép nối, tại đầu vào của 
nơron ta sẽ có tín hiệu i kjx W . 
 Bộ cộng: dùng để cộng tổng các tín hiệu đầu vào đã đƣợc khuếch đại bởi các trọng 
số ghép nối. Bộ cộng này còn đƣợc gọi là bộ tổng hợp tuyến tính. 
 Hàm kích hoạt (activation function): là hàm thể hiện biến đổi tuyến tính giữa các 
kích thích đầu vào của một nơron và tín hiệu đầu ra tƣơng ứng. Thực tế hàm 
kích hoạt này thƣờng hoạt động theo ngƣỡng: khi tổng các kích thích đầu vào 
vƣợt quá một ngƣỡng nhất định thì nơron sẽ tạo thành một xung điện áp tại đầu 
ra. Ngƣỡng kích hoạt này đƣợc thể hiện với giá trị phân cực (bias). Bên cạnh đó, 
hàm kích hoạt của nơron còn thực hiện nhiệm vụ hạn chế mức tín hiệu trong 
mạng (limiting function) khi có trƣờng hợp tín hiệu đầu vào nào đó vƣợt lớn 
quá. 
Mô hình nơron đƣợc thể hiện trên hình 3.17a (dạng chi tiết) và 3.17b (dạng rút gọn), 
trong đó hàm kích hoạt đƣợc sử dụng là hàm ngƣỡng với giá trị ngƣỡng là  . 
a) 
b) 
Hình 3.17: Mô hình nơron chi tiết (trái) và biểu diễn đơn giản hóa (phải) 
Theo hình trên, có tín hiệu đầu ra của nơron đƣợc xác định theo tuần tự: 
Tổng đáp ứng đầu vào: 
1
N
i i
i
u x W
  (3.15) 
Đáp ứng đầu ra: 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 44 - 
1
0
khi u
y u
khi u



1 (3.16) 
với hàm truyền đạt là hàm bƣớc nhảy Heaviside (hàm bƣớc nhảy đơn vị). 
Bên cạnh đó, còn có cách thứ hai để thể hiện công thức trên của một nơron trong 
đó giá trị ngƣỡng phân cực  đƣợc thể hiện bằng hệ số khuếch đại cho một đầu vào cố 
định “1” với hệ số khuếch đại là 0W  . Mô hình của nơron với cách mô tả này đƣợc 
thể hiện trên hình 3.18, theo đó đầu ra của nơron đƣợc tính theo công thức hàm bƣớc 
nhảy đơn vị: 
1 0
0 0
khi u
y u
khi u
1 (3.17) 
với 
0
N
i i
i
u x W
  , trong đó 0 01; .x W  
Hình 3.18: Mô hình nơron với phân cực bias là đầu vào x0: chi tiết (trái) và rút gọn (phải) 
3.4.1.2. Nơron với hàm truyền đạt tansig 
Nhƣ đã nhắc tới ở các phần trên, hàm truyền đạt ngƣỡng khá giống với mô tả của 
hàm truyền đạt của nơron sinh học. Tuy nhiên việc sử dụng hàm truyền đạt này có nhƣợc 
điểm lớn đó là đạo hàm của hàm ngƣỡng là hàm xung Dirac và hàm không liên tục, cụ thể: 
0 0
( ) ( )
0
khi tdf
f t t t
khi tdt

1 (3.18) 
Và khi đó việc sử dụng các thuật toán tối ƣu hóa với hàm ngƣỡng sẽ khó khăn hơn 
nhiều do trong đa số những thuật toán này sử dụng tới đạo hàm của các hàm truyền đạt. 
Trong luận án này, sẽ sử dụng hai dạng hàm truyền đạt kinh điển khác đó là hàm tansig và 
hàm tuyến tính (pureline) 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 45 - 
Hàm truyền đạt tansig của các nơron đƣợc định nghĩa bởi [69]: 
 ( ) tanh ( )
au au
a au au
e e
f u u
e e
 (3.19) 
Hình 3.19: Hàm truyền đạt tansig với các hệ số dốc a khác nhau 
Còn hàm tuyến tính có dạng: 
 f u purelin u a u b  (3.20) 
3.4.1.3. Các quá trình học và kiểm tra của nơron 
Với cấu trúc và nguyên tắc hoạt động nhƣ đã trình bày ở trên, có thể thấy rằng nơron 
thực chất là một khối tính toán có hàm truyền đạt phi tuyến. Điều khiến cho nơron trở nên 
khác biệt so với các mô hình phi tuyến khác của toán học là đi kèm với nơron đƣợc trang 
bị các thuật toán học và quá trình đánh giá chất lƣợng của nơron thông qua việc kiểm tra 
trên các mẫu số liệu mới. Có thể nói mỗi mô hình thông minh nói chung và mô hình nơron 
nói riêng đều có hai quá trình đặc trƣng là quá trình học (learning process) và quá trình 
kiểm tra (testing process). Sau đây sẽ tìm hiểu về hai quá trình này đối với mô hình nơron 
của McCulloch - Pitts. 
 Đặc trƣng quan trọng nhất của mạng nơron là khả năng mạng học từ môi trƣờng 
xung quanh nhằm mục đích giảm sai số và nâng cao chất lƣợng hoạt động của mạng. Quá 
trình học của nơron thƣờng là một quá trình lặp trong đó các trọng số ghép nối cũng nhƣ 
giá trị ngƣỡng phân cực của nơron đƣợc điều chỉnh thích nghi. Sau mỗi một lần lặp nơron 
học đƣợc nhiều hơn từ môi trƣờng. 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 46 - 
Định nghĩa trên của quá trình học bao gồm ba bƣớc: 
 Nơron đƣợc kích thích bởi môi trƣờng bên ngoài. 
 Nơron điều chỉnh các thông số của mình khi bị kích thích. 
 Đáp ứng đầu ra của mạng nơron sau khi điều chỉnh cũng sẽ thay đổi so với trƣớc 
khi điều chỉnh. 
Quá trình học sẽ đƣợc thực hiện theo những quy trình chặt chẽ còn đƣợc gọi là các 
thuật toán học. Với mỗi mạng nơron ta có rất nhiều các thuật toán học khác nhau đã đƣợc 
nghiên cứu và đề xuất. 
Các kiến thức đƣợc xây dựng dƣới dạng các cặp mẫu vào – ra ,dx (input-output 
samples), trong đó x – véc-tơ đầu vào mẫu còn d – đầu ra mẫu tƣơng ứng (còn gọi là đáp 
ứng với đầu vào x). Với tập số liệu học gồm p mẫu ,i idx với 1, ,i p  , véc-tơ đầu 
vào 
N
i x , giá trị đích (destination) cần đạt id cần xác định nơron có N đầu vào 
và 1 đầu ra với hàm truyền đạt f() sao cho: 
 , i ii f d x (3.22) 
hay có thể sử dụng hàm mục tiêu là tổng các bình phƣơng sai số: 
2
1
1
min
2
p
i i
i
E f d
  x (3.23) 
Hình 3.20: Hệ xây dựng mô hình xấp xỉ một đối tượng cho trước (phối hợp sử dụng sai số đầu ra 
e y d ) 
Trên hình 3.20 là sơ đồ khối chức năng mô tả quá trình học này. “Hƣớng dẫn” đƣợc 
hiểu là tập hợp các kiến thức đƣợc trích ra từ môi trƣờng. Khi cho nơron học theo một 
mẫu, đầu tiên cho x vào đầu vào của nơron, nơron sẽ tổ chức tính toán với đầu vào mới và 
đƣa ra đáp ứng y. Đáp ứng y thƣờng sẽ sai lệch so với giá trị đích cần đạt là d, khi đó tín 
hiệu sai số e y d sẽ đƣợc sử dụng để điều chỉnh các thông số của hệ thống học nhằm 
mục đích giảm giá trị e về nhỏ nhất có thể. Khi sai số 0e thì nơron sẽ dừng quá trình 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 47 - 
học và các tham số của nơron đƣợc giữ nguyên. Trong trƣờng hợp có 1p mẫu, các trọng 
số cần đƣợc điều chỉnh để giảm đồng thời đƣợc tất cả các sai số i i ie y d (với 
1,2, ,i p  ). Khi đó trong nhiều trƣờng hợp không đạt đƣợc kết quả 0E . 
Do mô hình nơron thƣờng là mô hình có hàm truyền phi tuyến nên thực chất đây là 
bài toán tối ƣu hóa phi tuyến hay còn gọi là bài toán tìm cực trị của hàm phi tuyến đa biến 
trong không gian đa chiều. Các bài toán này khó có lời giải trực tiếp để đƣa ra nghiệm toàn 
cục mà các thuật toán thƣờng là thuật toán lặp để tìm nghiệm cận tối ƣu. Khi quá trình lặp 
đƣợc kết thúc, mô hình học đã thu nhận đƣợc các thông tin của tập mẫu, qua đó đã phần 
nào học đƣợc về vấn đề từ môi trƣờng xung quanh. Nếu chất lƣợng học đã có thể chấp 
nhận đƣợc, sẽ cố định các giá trị tham số và để mô hình học hoạt động độc lập. Tuy nhiên 
do tập mẫu thƣờng có kích thƣớc hạn chế, không thể chứa hết tất cả các trƣờng hợp có thể. 
Vì vậy ngoài việc học xong tập mẫu, còn cần đánh giá khả năng hoạt động của mô hình đối 
với các trƣờng hợp mẫu khác tập mẫu đã biết. 
3.4.1.4. Thuật toán học có hƣớng dẫn của nơron 
Có rất nhiều thuật toán học đã đƣợc nghiên cứu và phát triển. Phần này sẽ trình bày 
về một thuật toán cơ bản nhất là học có hƣớng dẫn (supervised learning, learning with a 
teacher) trên cơ sở lan truyền ngƣợc sai số (error backpropagation). Thuật toán này đƣợc 
phát triển dựa trên thuật toán bƣớc giảm cực đại (steppest descent) để xác định giá trị cực 
tiểu của một hàm số. 
a. Thuật toán bƣớc giảm cực đại 
Nội dung của thuật toán bƣớc giảm cực đại có thể đƣợc trình bày tóm tắt nhƣ sau: 
“Cho một hàm f(x) bất kỳ, tìm điểm cực tiểu minx của hàm số đã cho trong trƣờng hợp 
việc giải phƣơng trình ( ) 0f x không khả thi hoặc quá phức tạp”. 
Nhƣ đã biết, đối với những hàm đơn giản, có thể sử dụng phƣơng pháp tìm các điểm 
cực tiểu bằng cách giải phƣơng trình ( ) 0f x , nhƣng trong nhiều trƣờng hợp việc giải 
phƣơng trình này cũng không dễ dàng, khi đó có thể sử dụng một trong các phƣơng pháp 
lặp, mà phƣơng pháp bƣớc giảm cực đại là một trong những ví dụ kinh điển. Nội dung 
chính của thuật toán nhƣ sau. Xuất phát từ một giá trị khởi đầu 
(0)x . Ta cần tìm điểm (1)x 
sao cho (1) (0)f x f x . Sau đó tìm điểm (2)x sao cho (2) (1)f x f x . Nếu tiếp 
tục quá trình tìm kiếm nhƣ vậy, sẽ thu đƣợc kết quả là một chuỗi ( )tx mà giá trị hàm số 
 ( )tf x giảm dần và sẽ đạt tới một trong các cực tiểu của hàm f(x). Khi đó: 
 ( )
min
t
t
x x
 (3.24) 
Theo thuật toán bƣớc giảm cực đại sẽ có công thức xác định bƣớc tiếp theo là: 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 48 - 
( )
( 1) ( )
t
t t
x x
f
x x
x
 


 (3.25) 
trong đó:  - hệ số bƣớc học. Công thức này là hệ quả của phép khai triển Tay-lor bậc 
nhất của hàm số f lân cận điểm x(t), theo đó: 
 ( ) ( ) ( ) 2t t tf x f x f x   (3.26) 
 Nếu chọn ( )tf x  với  đủ nhỏ thì: 
2
( ) ( ) ( ) 2 ( )t t t tf x f x f x f x   (3.27) 
Từ đó nếu chọn 
( )
( 1) ( ) ( )
t
t t t
x x
f
x x x
x
 


 thì giá trị hàm số tại điểm 
( 1)tx 
sẽ giảm (với  đủ nhỏ). 
b. Sử dụng thuật toán bƣớc giảm cực đại cho một nơron 
Trong quá trình học của mạng nơron cần xác định điểm cực tiểu của hàm sai số. Với 
mô hình nơron nhƣ trên hình 3.18 và bộ số liệu p mẫu , , 1, ,i id i p x  có tín hiệu đầu 
ra ứng với mẫu đầu vào ix là: 
0
N
i j ij
j
y f W x
 (3.28) 
Sai số trên bộ số liệu học là: 
2
1
1
2
p
i i
i
E y d
  (3.29) 
Cần tìm các trọng số jW ( 0,1,...,j N ) hay còn gọi là véc-tơ trọng số  W để 
giảm sai số cho theo (3.29). Bắt đầu từ một bộ giá trị ban đầu nào đó 
 
(0) (0) (0)(0)
0 1, , , NW W W
W  , theo công thức (3.25), các trọng số đƣợc điều chỉnh 
thích nghi theo công thức: 
Chương 3: Các công cụ tính toán mô phỏng sử dụng trong luận án 
- 49 - 
   
( 1) ( )
( )
t t
t
j j
j
E
W W
W



W W
 (3.30) 
với 0,1, ; 0,1, , .t N   
Trong đó gradient của sai số theo các trọng số đƣợc xác định theo: 
1
0
1 0
1 0
p
i
i i
i
N
j ij
p N
j
i i j ij
i j
p N
i i j ij i
i j
yE
y d
W W
W x
y d f W x
W
y d f W x x

 
 
  


 
 
(3.31) 
c.
File đính kèm:
luan_an_nghien_cuu_phuong_phap_xac_dinh_vi_tri_su_co_tren_du.pdf
2014-05-29-Thong_tin_dua_len_mang-Truong Tuan Anh DHBK HN.pdf
2014-05-29-Tom_tat_luan_an_TS-Truong Tuan Anh DHBK HN.pdf