Luận án Nghiên cứu, phát triển kỹ thuật định vị trong nhà sử dụng tín hiệu Wi-fi
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
Bạn đang xem 10 trang mẫu của tài liệu "Luận án Nghiên cứu, phát triển kỹ thuật định vị trong nhà sử dụng tín hiệu Wi-fi", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.
Tóm tắt nội dung tài liệu: Luận án Nghiên cứu, phát triển kỹ thuật định vị trong nhà sử dụng tín hiệu Wi-fi
tiêu trong mục này là xây dựng thuật toán EM ước lượng các tham số của GMM khi một phần dữ liệu không quan sát được do censoring (EM-C-GMM: The EM algorithm for parameter estimation of the GMM in the presence of Censored mixture data) [CT3]. Gọi 11 1 1 Δ Δ Δ Δ J N NJ Δ là tập các biến nhị phân tiềm ẩn (latent variables), Δ 1nj khi ny thuộc thành phần Gauss thứ j ; Δ 0nj với các trường hợp khác. Khi đó, hàm hợp lý (LF) được xác định như sau [1, 8]: 1 1 ; , p ; . njN J j n j n j w yΘ y Δ (2.15) LLF sẽ là: 1 1 ln ; ln p ; . N J nj j n j n j w yΘ y,Δ (2.16) Bước E: 42 ( ) ( ) ( ) 1 1 Q ; ln ; , ln p ; p , | ; ; d . k k N J k nj j n j n nj n n n j w y y x y Θ Θ Θ y Δ Θ x Θ (2.17) Khi 0nj , ( )Q ; 0k Θ Θ ; khi 1nj , công thức (2.17) được viết lại như sau: ( ) ( ) 1 1 Q ; ln p ; p , 1| ; d . N J k k j n j n nj n n n j w y y x yΘ Θ Θ (2.18) Hàm ( )Q ; kΘ Θ trong công thức (2.18) được tính cho trường hợp n nx y và trường hợp nx c (chi tiết như trong phụ lục 4), kết quả như sau: ( ) ( ) ( ) ( ) ( ) 1 1 1 1 0 1 ln ln β Q ; ; ; ; ; dln ln I . N J n j k k n j n j k n jk j n n j cN J n n n j j k j j z w z w x x y y y Θ Θ (2.19) Trong công thức (2.19), ( 1 )nz n N là các biến nhị phân thể hiện các mẫu dữ liệu quan sát được hoặc không quan sát được. 0nz khi n nx y , khi đó ny c ; 1nz khi nx c , khi đó ny c . Ngoài ra ( ); kn jx và ( )β kj được xác định như sau: ( ) ( ) ( ) ( ) ( ) 1 ; ; ; ; k k j n jk n j J k k j n j j w x x w x (2.20) ( ) ( ) ( ) ( ) ( ) 0 1 0 I β I . k k j jk j J k k j j j w w (2.21) 43 )0 (I kj là tích phân được tính toán chi tiết như trong phụ lục 1, kết quả: ( ) ( ) ( ( )0 ) 1; d erf .I c 2 2 kc jk k j n j n k j c y y (2.22) Bước M: Các tham số ước lượng được ở lần lặp thứ ( 1)k + được xác định bằng cách lần lượt lấy đạo hàm riêng của ( )Q ; kΘ Θ trong công thức (2.19) theo , ,j j jw và gán bằng 0 (chi tiết như trong phụ lục 5), kết quả như sau: ( ) ( ) ( ) ( ) ( 1) ( ) ( ) ( ) 1 1 10 1 ) 1 ( 1 0 I 1 β I I . 1 ; I ; β N N n n n n n k jk k n j j k jk j k jk k n j j k N N n n n nj z x z z z x x (2.23) ( ) ( ) ( 1)2 ( ) ( ) ( ) ( ) ( ) 2( ) ( ) ( ) ( ) ( ) ( ) 2 1 1 1 2 1 10 0 1 1 ; ; + . ; 1 1 β I 2 I β I I 1 β k k n j jk j k k n j j k k k j j jk k j jk k j N n n n N N n n n n j N n n N N n n k j n n k n j z x z z z x x x z z (2.24) ( ) ( ) ( 1) 1 1 ;1 β . N N n n n n k k n j j k j xz z N w (2.25) Trong các công thức (2.23)-(2.25), )1 (I kj và )2 (I kj là các tích phân, được tính toán chi tiết như trong phụ lục 2, 3, kết quả như sau: 44 2( ) ( ) ( ) ( ) 1 0 ( ) ( ) 1 exp ; 2 I 2 I k jk k k k j j j j k j c (2.26) 2( ) 2 2( ) ( ) ( ) ( ) ( ) 2 0 ( ) ( ) 1 eI xp . 2 2 I k jk k k k k k j j j j j j k j c c (2.27) Từ các công thức (2.23)-(2.25) có thể nhận thấy nếu 0 nz với 1 n N (không xảy ra censoring hay dữ liệu thu được đầy đủ), các công thức này rút gọn về các công thức của thuật toán EM ước lượng các tham số của GMM tiêu chuẩn (EM-GMM: The EM algorithm for parameter estimation of the standard GMM). Mặt khác, nếu 1J , công thức (2.23) và (2.24) rút gọn về các công thức của thuật toán EM ước lượng các tham số của phân phối Gauss khi một phần dữ liệu không quan sát được do censoring (EM-C-G: EM algorithm for parameter estimation of Gaussian distribution in the presence of Censored data) [25]. Điều này có nghĩa là ngoài giải quyết được đồng thời vấn đề đa thành phần Gauss trong phân bố của dữ liệu và một phần dữ liệu không quan sát được do censoring (trường hợp (6), mục 1.2), EM-C-GMM [CT3] còn hoàn toàn đúng khi được sử dụng ước lượng các tham số của tập dữ liệu đầy đủ, có phân bố tuân theo GMM [4, 49] (trường hợp (5), mục 1.2) hoặc tập dữ liệu với một phần không quan sát được do censoring, có phân bố tuân theo phân phối Gauss [25] (trường hợp (1), (2), mục 1.2). 2.4. Ước lượng các tham số của GMM khi một phần dữ liệu không quan sát được do dropping. Mục tiêu trong mục này là xây dựng thuật toán EM ước lượng các tham số của GMM khi một phần dữ liệu không quan sát được do dropping 45 (EM-D-GMM: The EM algorithm for parameter estimation of the GMM in the presence of Dropped mixture data) [CT2]. Để mô tả các mẫu dữ liệu không quan sát được do dropping, tập d được đưa vào LF, khi đó LLF trở thành: 1 1 ln ; , ln p , ; . N J nj j n n j n j w y dΘ y d,Δ (2.28) Bước E: ( ) ( ) 1 ( ) 1 1 0 Q ; ln ; , ln p , ; p , , ; | ; d . n k k N J k nj j n n j n n nj n n n j d w y d y d x y Θ Θ Θ y d,Δ Θ x Θ (2.29) Hàm ( )Q ; kΘ Θ trong công thức (2.29) được tính cho trường hợp không xảy ra dropping ( 0 nd , khi đó ) n nx y và xảy ra dropping ( 1 nd , khi đó ) nx c . Chi tiết tính toán như trong phụ lục 6, kết quả như sau: ( ) 1 1 1 ( ) ( 1 ) ln ln 1 ln ln l Q 1 n ; ; .; N J k n j j n k k n j n j j N J n j n j d w xd wx wΘ Θ (2.30) Trong công thức (2.30), P( 1)nd là xác suất xảy ra hiện tượng dropping. Bước M: Các tham số ước lượng được ở lần lặp thứ ( 1)k + được xác định bằng cách lần lượt lấy đạo hàm riêng của ( )Q ; kΘ Θ theo , , ,j j jw và gán bằng 0 (tương tự mục 2.3). Kết quả như sau: 46 ( 1 ) ( 1 1) ( ) ; . ; 1 1 N n n n k n j k j k j N n n n xd x xd (2.31) 2(( ) ( 1)2 ( ) ) 1 1 ; . 1 1 ; N kk n jk j k n j n n j n N n n xd x d x (2.32) ( ) 1 1 ( ) ( 1) 1 ; . N N n n k k n j j k j n n x wd d N w (2.33) ( 1) 1 . N n nk d N (2.34) Từ các công thức (2.31)-(2.34) có thể nhận thấy nếu 0 (không xảy ra dropping), các công thức này rút gọn về các công thức của EM-GMM [4, 49]. Điều này có nghĩa là ngoài giải quyết được đồng thời vấn đề đa thành phần Gauss trong phân bố của dữ liệu và một phần dữ liệu không quan sát được do dropping (trường hợp (7), mục 1.2), EM-D-GMM [CT2] hoàn toàn đúng trong trường hợp dữ liệu thu thập được là đầy đủ, có phân bố gồm đa thành phần Gauss (trường hợp (5), mục 1.2). Ngoài ra, nếu 1 J , các công thức (2.31), (2.32) và (2.34) rút gọn về các công thức của thuật toán EM ước lượng các tham số của phân phối Gauss khi một phần dữ liệu không quan sát được do dropping (trường hợp (1), (3) mục 1.2). 2.5. Ước lượng các tham số của GMM khi một phần dữ liệu không quan sát được do censoring và dropping Mục tiêu trong mục này là xây dựng thuật toán EM ước lượng các tham số của GMM khi một phần dữ liệu không quan sát được do censoring và 47 dropping (EM-CD-GMM: The EM algorithm for parameter estimation of the GMM in the presence of Censored and Dropped mixture data). Gọi ( 1 )nv n N là các biến nhị phân thể hiện các mẫu dữ liệu quan sát được hoặc không quan sát được. 0nv khi ny c và 0nd , khi đó n nx y . Vì các mẫu dữ liệu không quan sát được do censoring hay dropping đều có giá trị bằng c nên: 1nv khi ny c hoặc 1nd , khi đó . nx c Bước E: ( ) ( ) 1 ( ) 1 1 0 Q ; ln ; , ln p , ; p , , ; | ; d . n k k N J k nj j n n j n n nj n n n j d w y d y d x y Θ Θ Θ y d,Δ Θ x Θ (2.35) Đặt ( ) ( )F , , , ; p , , | ;k kn n n nj n n nj ny d x y d x Θ Θ , ta có: ( ) ( ) ( ) ( ) ( ) ( ) F , , , ; p | , , ; P | , ; p | ; P ; . p ; k n n n nj k k k k n n n nj n n nj n nj nj k n y d x y d x d x x x Θ Θ Θ Θ Θ Θ (2.36) Với trường hợp 0nv , khi đó ny c và 0nd hàm ( )Q ; kΘ Θ được tính tương tự như trường hợp 0nd trong mục 2.4, kết quả được: ( ) ( )0 1 1 Q ; ;1 ln ln ln1 ; . n k kv n j n N J jn j n j xv w xΘ Θ (2.37) Với trường hợp 1nv , xét hai trường hợp: Trường hợp 1: 0nd , khi đó ny c , các thành phần của hàm ( )F , , , ; kn n n njy d x Θ trong công thức (2.36) được tính cụ thể như sau: 48 ( ) ( ) ( ) ( ) 0 ; p | , , 1; p | c, 0 ;; I k n jk k n n n nj n n n j k j y y x d y x dΘ (2.38) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 0 1 ( ) ( ) ( ) ( ) 0 1 P | , ; p , | 0; P 0 p , | 0; P 0 p , | 1; P 1 1 I ; 1 I k n n nj k n nj n n k k n nj n n n nj n n J k k k j j j J k k k k j j j d x x d d x d d x d d w w Θ Θ Θ Θ (2.39) ( ) ( )P 1; ;k knj jw Θ (2.40) ( ) ( ) ( ) ( )0p | ; p | 1; p ; I ;k k k kn nj n nj n j jx x x Θ Θ ( ) ( ) ( ) ( ) ( ) 1 1 0p Ip ; ; . J J k k k k k n j n j j j j j x w x wΘ (2.41) Đặt ( ) ( ) ( ) 0 1( ) ( ) ( ) ( ) ( ) ( ) 0 1 1 I , 1 α I J k k k j j jk k J k k k k j j j w w Θ , từ (2.38)-(2.41) suy ra: ( ) ( ) ( ) ( ) ( ) ( ) ( ) 1, 0 ( 0 0 0 ) ( ) 1 ( ) ( ) ( ) ( ( ) 0 ) ; , F , , , ; ; α I I I β α . , I n n k n j k k k k j jk jk v d n n n nj J k k j j j k n jk k k j k j y w y d x w y Θ Θ Θ (2.42) Mặt khác, p , ;n n jy d trong công thức (2.35) được tính như sau: p , ; p | 0; P 0; 1 ; . n n j n n j n j n jy d y d d y (2.43) 49 Từ (2.35), (2.42) và (2.43), ta có: ( ) 1, 0 ( ) ( ) ( ) ( ) 1 ) 1 0 (β α ln ln Q ; ; , I 1 ; d . n n k v d kc n jk k k j N J n j n j n j k jn v y yw y Θ Θ Θ (2.44) Trường hợp 2: 1nd , khi đó nx c , các thành phần của hàm ( )F , , , ; kn n n njy d x Θ trong công thức (2.36) được tính cụ thể như sau: ( ) ( )p | , , 1; p | c, 1; δ ; k kn n n nj n n n j ny x d y x d y c (2.45) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 0 1 P | , ; p , | 1; P 0 p , | 0; P 0 p , | 1; P 1 1 , ; 1 I α k n n nj k n nj n n k k n nj n n n nj n n k k k J k k k k j j j d x x d d x d d x d d w Θ Θ Θ Θ Θ (2.46) ( ) ( )P 1; ;k knj jw Θ (2.47) ( ) ( ) ( ) ( ) p | ; p | 1; p ; p c | 1; P 1 δ ; k k k n nj n nj n j k n n j n n x x x x d d x c Θ Θ (2.48) ( ) ( ) ( ) ( ) 1 1 p ; δp ; .δ J J k k k k n j n j n j n j j x w x x c w x cΘ (2.49) Trong các công thức (2.45), (2.48) và (2.49), δ . là hàm Kronecker Delta. Từ (2.45)-(2.49) ta có: ( ) ( ) ( ) ( )1, 1F , , , ; 1 , .α δ n n k k k kv d n n n nj j ny d x w y cΘ Θ (2.50) Mặt khác, p , ;n n jy d trong công thức (2.35) được tính như sau: 50 p , ; p | 1 δ; P 1 . n n j n n j n ny d y d d y c (2.51) Từ (2.35), (2.50) và (2.51), ta có: 1 1 1 1 ( ) 1, 1 ( ) ( ) ( ) ( ) ( ) ( ) Q ; 1 , d 1 , ln . α ln δ δ α n n N J n n n j N J k v d c k k k j n n k k k n n j j v y v w y c y c w Θ Θ Θ Θ (2.52) Kết hợp (2.37), (2.44) và (2.52) ta có: ( ) ( ) ( ) ( ) 0 1, 0 1, 1 ( ) ( ) ( ) ( ) ( ) ( ) ( 1 1 1 1 0 1 1 ) ( Q ; Q ; Q ; Q ; ; 1 ; ; , 1 ; 1 ln ln ln β α ln ln d I α1 n n n n n k k k k v v d v d k n j n j k N J n j n j N J n c n jk k k j n j k j k k j n n j N J jn n j v w v x x y y w w y v Θ Θ Θ Θ Θ Θ Θ Θ Θ Θ ) ( ), ln . k (2.53) Bước M: Các tham số ước lượng được ở lần lặp thứ ( 1)k + được xác định bằng cách lần lượt lấy đạo hàm riêng của ( )Q ; kΘ Θ trong công thức (2.53) theo , , ,j j jw và gán bằng 0 (tương tự mục 2.3). Kết quả như sau: 1 ( ) ( ) ( ) ( ) ( ) ( ) ( 1) ( ) 1 10 1 ( ) ( ) ( 1 ) ; , . ; I 1 β α I 1 β ,α k jk k k k n j j k jk j k N N n n n k k k n j n n N N n n n n j v x v v x v x Θ Θ (2.54) 51 2( ) ( ) ( 1)2 ( ) ( ) 1 ( ) ( ) ( ) ( ) ( ) 2( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( 1 1 2 1 10 0 1 1 1 β α I 2 I β α ; ; , , + ; , I I 1 β α k k N n n n N N n n n n N n j jk j k k k k n j j k k k j j jk k k k j jk k j j k k k n j n n N n n j v x v v v v x x x Θ Θ Θ 1 ) . n k N nv (2.55) ( ) ( ) ( ) ( ) 1 1( 1) ( 1 ( ) ) ; , 1 , . 1 β α α k k k k n j j k j k k N N n n n n N n n v v N v N x w Θ Θ (2.56) ( ) ( ) ( ) 11 ,α . 1 k k n nk N v N Θ (2.57) Từ các công thức (2.53) - (2.57) có thể nhận thấy: - Nếu 0 (không xảy ra dropping), (2.53) - (2.56) rút gọn về các công thức ước lượng tham số của GMM khi một phần dữ liệu không quan sát được do censoring (EM-C-GMM) [CT3]; - Nếu : nn y c (không xảy ra censoring), (2.53) - (2.57) rút gọn về các công thức ước lượng tham số của GMM khi một phần dữ liệu không quan sát được do dropping (EM-D-GMM) [CT2]; - Nếu 0nv (dữ liệu thu thập được đầy đủ), (2.53) - (2.56) rút gọn về các công thức ước lượng tham số của GMM tiêu chuẩn (EM-GMM) [4, 49]; - Nếu 1J và 0 , (2.53), (2.54) và (2.55) rút gọn về các công thức của EM-C-G [25]; 52 - Nếu 1J , (2.53)-(2.55) và (2.57) rút gọn về các công thức của thuật toán EM ước lượng tham số của phân phối Gauss khi một phần dữ liệu không quan sát được do censoring và dropping (EM-CD-G: EM algorithm for parameter estimation of Gaussian distribution in the presence of Censored and Dropped data) [26]; Từ các lập luận trên có thể kết luận: EM-CD-GMM [CT4] ngoài việc giải quyết được đồng thời cả ba vấn đề, bao gồm đa thành phần Gauss trong phân bố của Wi-Fi RSSI, censoring và dropping (các trường hợp (5)-(8), mục 1.2) còn hoàn toàn đúng với khi dữ liệu có phân bố tuân theo phân phối Gauss (các trường hợp (1)-(4), mục 1.2). 2.6. Đánh giá sai số của các tham số trong GMM ước lượng được bằng thuật toán EM Trong mục này, thuật toán EM-CD-GMM sẽ được kiểm nghiệm và so sánh với các thuật toán EM khác đã được công bố. Cụ thể hơn, sai số của các tham số trong GMM được ước lượng bằng các thuật toán EM-CD-GMM, EM-GMM [4, 49] và EM-CD-G [26] sẽ được đánh giá trên cùng một tập dữ liệu mô phỏng (artificial data). Tập dữ liệu mô phỏng được tạo ra trên Matlab theo trình tự như sau: - Tạo tập dữ liệu đầy đủ ( y ) có phân bố tuân theo GMM với các tham số (true parameters): 1 2; 0.5;0.5w w ; 1 2; 90; 80 ; 1 2; 3;4 ; 2J ; 1000N (phụ lục 7). - Tạo tập dữ liệu không đầy đủ (x ) từ tập y bằng hàm max( , )n nx y c , với c thay đổi từ 96(dBm) đến 84(dBm) , thay đổi từ 0 đến 0.3 (phụ lục 7). 53 Để đánh giá các thuật toán EM, khoảng cách Kullback Leibler (KLD: Kullback Leibler Divergence) [24] được sử dụng. Gọi KLD là giá trị trung bình của KLD sau M lần thực nghiệm, KLD được xác định như sau: - Với thuật toán EM-GMM và EM-CD-GMM: 2 2 1 10 2 1 1 2 1 1 exp 2 21 1 log . ˆ1ˆ exp ˆ2 ˆ2 J nm j j M N j j j KLD Jm n nm jm jm j jm jm y w M N y w (2.58) Trong công thức (2.58), nmy là các mẫu dữ liệu được tạo ra ở lần thực nghiệm thứ ( 1 ) m m M ; ˆ jm , ˆ jm , ˆ jmw là các tham số ước lượng được (estimated parameters) ở lần thực nghiệm thứ m bằng EM-GMM hoặc EM- CD-GMM. - Với thuật toán EM-CD-G: 2 2 1 10 2 1 1 2 1 exp 2 21 1 log . ˆ1 exp ˆ2 ˆ2 J nm j j M N j j j KLD m n nm m m m y w M N y (2.59) Trong công thức (2.59), ˆm , ˆm , ˆ mw là các tham số ước lượng được ở lần thực nghiệm thứ m bằng EM-CD-G. Sau 1000 lần thực nghiệm ( 1000) M , KLD của các thuật toán được thể hiện như bảng 2.1 và độ lệch chuẩn ( KLD ) được thể hiện như bảng 2.2. 54 Bảng 2.1. KLD của các thuật toán EM sau 1000 lần thực nghiệm c (dBm) Thuật toán 0 0.075 0.15 0.225 0.3 –96 EM-GMM 0.0018 0.0288 0.4317 1.1377 3.9022 EM-CD-G 0.0664 0.0728 0.0872 0.0958 0.1048 EM-CD-GMM 0.0016 0.0023 0.0027 0.0033 0.0036 –93 EM-GMM 0.0329 0.265 0.7725 1.6687 5.4476 EM-CD-G 0.0679 0.0792 0.0933 0.1272 0.1778 EM-CD-GMM 0.0034 0.0044 0.0121 0.0163 0.0235 –90 EM-GMM 3.1491 3.2325 3.3142 3.5054 6.1253 EM-CD-G 0.0798 0.0864 0.1096 0.1329 0.1998 EM-CD-GMM 0.0098 0.0111 0.0229 0.0334 0.0364 –87 EM-GMM 5.6358 5.6505 5.7878 7.4773 7.6172 EM-CD-G 0.0886 0.1249 0.1461 0.1872 0.2253 EM-CD-GMM 0.0126 0.0211 0.0389 0.0443 0.0947 –84 EM-GMM 7.2847 7.3424 7.3649 8.0163 8.7835 EM-CD-G 0.0972 0.1556 0.1836 0.2029 0.3878 EM-CD-GMM 0.0481 0.0634 0.0785 0.1115 0.1241 Bảng 2.2. KLD của các thuật toán EM sau 1000 lần thực nghiệm c (dBm) Thuật toán 0 0.075 0.15 0.225 0.3 –96 EM-GMM 0.0151 0.0246 1.1053 1.3516 1.4934 EM-CD-G 0.0172 0.0182 0.0658 0.131 0.2185 EM-CD-GMM 0.0139 0.0153 0.0186 0.02 0.0383 –93 EM-GMM 0.0323 0.1244 1.2243 1.4871 1.7042 EM-CD-G 0.0175 0.0192 0.1154 0.1671 0.2356 EM-CD-GMM 0.0176 0.0182 0.026 0.047 0.0665 –90 EM-GMM 0.0351 0.3535 1.7911 2.202 2.4937 EM-CD-G 0.1199 0.1364 0.1535 0.1963 0.296 EM-CD-GMM 0.0227 0.0601 0.0857 0.1005 0.1302 –87 EM-GMM 0.1025 0.8761 2.0984 2.3214 2.9138 EM-CD-G 0.1325 0.1632 0.2654 0.4974 0.5215 EM-CD-GMM 0.0451 0.0769 0.0968 0.1204 0.1402 –84 EM-GMM 0.1984 1.0912 2.1361 2.6663 3.6588 EM-CD-G 0.1851 0.2029 0.3025 0.5963 0.6813 EM-CD-GMM 0.0624 0.086 0.1207 0.1393 0.1527 55 Từ các kết quả thực nghiệm trong bảng 2.1 và bảng 2.2 có thể nhận thấy: - Với 0 và 96c , dữ liệu quan sát được gần như đầy đủ. Khi đó không có sự sai lệch lớn giữa GMM có các tham số được ước lượng bằng EM-GMM và GMM có các tham số được ước lượng bằng EM-CD-GMM. Cụ thể, KLD và KLD của EM-GMM lần lượt là 0.0018 và 0.0151; KLD và KLD của EM-CD-GMM lần lượt là 0.0016 và 0.0139. EM-CD-G có sai số lớn hơn do coi phân bố của dữ liệu tuân theo phân phối Gauss (KLD và KLD có giá trị lần lượt là 0.0664 và 0.0172). - Với các trường hợp khác, KLD và KLD của EM-CD-GMM luôn nhỏ nhất. Bởi vậy EM-CD-GMM là thuật toán có thể ước lượng chính xác nhất mô hình mô tả phân bố của Wi-Fi RSSI khi tập dữ liệu thu thập được có phân bố gồm đa thành phần Gauss, một phần không quan sát được do censoring và dropping. Ngoài ra, hình 2.3 thể hiện tương quan giữa số lượng mẫu dữ liệu (N) và sai số toàn phương trung bình (MSE: Mean Squared Error) của các tham số trong GMM được ước lượng bởi EM-CD-GMM khi 90c và 0.15 sau 1000 lần thực nghiệm (trung bình tỷ lệ dữ liệu quan sát được là 56.25%). MSE của từng tham số được xác định như sau: 2 2 1 1 2 2 1 1 ˆ ˆ ˆ ˆMSE ; MSE ; ˆˆ ˆˆMSE ; MSE . M M jm j jm j m m j j M M jm j m m m j M M w w w M M (2.60) 56 Hình 2.3. Tương quan giữa số lượng mẫu dữ liệu (N) và MSE của các tham số trong GMM được ước lượng bởi EM-CD-GMM Trên hình 2.3, MSE giảm dần khi N tăng dần. Điều này đồng nghĩa với số lượng mẫu dữ liệu thu thập được trong giai đoạn huấn luyện ngoại tuyến càng lớn thì GMM với các tham số ước lượng bởi EM-CD-GMM càng mô tả chính xác phân bố của chúng. 2.7. Kết luận chương 2 Trong chương 2, tác giả đề xuất sử dụng GMM mở rộng để mô tả phân bố của Wi-Fi RSSI và xây dựng các thuật toán ước lượng các tham số của GMM trong các trường hợp: một phần dữ liệu không quan sát được do censoring; một phần dữ liệu không quan sát được do dropping; một phần dữ liệu không quan sát được do censoring và dropping. Các kết quả thực nghiệm đã chứng minh hiệu quả của thuật toán EM-CD-GMM so với EM-GMM [4, 49] và EM-CD-G [26]. 57 Chương 3 bao gồm các nội dung chính: Các phương pháp ước lượng số thành phần Gauss trong GMM; đề xuất thuật toán ước lượng số thành phần Gauss dựa trên tiêu chuẩn thông tin B
File đính kèm:
- luan_an_nghien_cuu_phat_trien_ky_thuat_dinh_vi_trong_nha_su.pdf
- Thong_tin_LA_tieng_Anh.pdf
- Thong_tin_LA_tieng_Viet.pdf
- Tom_tat_LA_tieng_Anh.pdf
- Tom_tat_LA_tieng_Viet.pdf