Luận án Nghiên cứu và phát triển các kỹ thuật định vị và định danh kết hợp thông tin hình ảnh và Wifi

Luận án Nghiên cứu và phát triển các kỹ thuật định vị và định danh kết hợp thông tin hình ảnh và Wifi trang 1

Trang 1

Luận án Nghiên cứu và phát triển các kỹ thuật định vị và định danh kết hợp thông tin hình ảnh và Wifi trang 2

Trang 2

Luận án Nghiên cứu và phát triển các kỹ thuật định vị và định danh kết hợp thông tin hình ảnh và Wifi trang 3

Trang 3

Luận án Nghiên cứu và phát triển các kỹ thuật định vị và định danh kết hợp thông tin hình ảnh và Wifi trang 4

Trang 4

Luận án Nghiên cứu và phát triển các kỹ thuật định vị và định danh kết hợp thông tin hình ảnh và Wifi trang 5

Trang 5

Luận án Nghiên cứu và phát triển các kỹ thuật định vị và định danh kết hợp thông tin hình ảnh và Wifi trang 6

Trang 6

Luận án Nghiên cứu và phát triển các kỹ thuật định vị và định danh kết hợp thông tin hình ảnh và Wifi trang 7

Trang 7

Luận án Nghiên cứu và phát triển các kỹ thuật định vị và định danh kết hợp thông tin hình ảnh và Wifi trang 8

Trang 8

Luận án Nghiên cứu và phát triển các kỹ thuật định vị và định danh kết hợp thông tin hình ảnh và Wifi trang 9

Trang 9

Luận án Nghiên cứu và phát triển các kỹ thuật định vị và định danh kết hợp thông tin hình ảnh và Wifi trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 31 trang nguyenduy 24/04/2024 890
Bạn đang xem 10 trang mẫu của tài liệu "Luận án Nghiên cứu và phát triển các kỹ thuật định vị và định danh kết hợp thông tin hình ảnh và Wifi", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

Tóm tắt nội dung tài liệu: Luận án Nghiên cứu và phát triển các kỹ thuật định vị và định danh kết hợp thông tin hình ảnh và Wifi

Luận án Nghiên cứu và phát triển các kỹ thuật định vị và định danh kết hợp thông tin hình ảnh và Wifi
ời).
Vị tr½ người tr¶n £nh được x¡c định trong nghi¶n cùu này là trung điểm cõa c¤nh
h¼nh chú nhªt ti¸p xúc với mặt sàn (xem H¼nh 3.2). Điểm này gọi là vị tr½ điºm ch¥n
người FootPoint. Theo v¸t người trong mët chuéi khung h¼nh thu được tø mët trường
quan s¡t camera là qu¡ tr¼nh theo v¸t c¡c điểm ch¥n người. Trong trường hñp có nhi·u
người, méi điểm ch¥n đưñc ph¡t hi»n c¦n được g¡n với định danh tương ùng. Định vị
người được thực hi»n b¬ng c¡ch chuyºn c¡c vị tr½ điểm ch¥n tr¶n tọa độ £nh sang c¡c
vị tr½ trong tọa độ th¸ giới thực tr¶n mặt ph¯ng sàn.
 Khi mët người dịch chuyºn tø mët trường quan s¡t này sang trường quan s¡t
kh¡c, định danh và vị tr½ tương ùng c¦n được cªp nhªt. Qu¡ tr¼nh cªp nhªt này gọi là
định danh l¤i và li¶n k¸t quỹ đạo chuyºn động cõa người.
 - Ph¡t hi»n người: Như đã n¶u ở ph¦n c¡c nghi¶n cùu có li¶n quan, có hai hướng
ti¸p cªn cho ph¡t hi»n người: ph¡t hi»n dựa tr¶n chuyºn động và ph¡t hi»n với bë ph¥n
lớp người. Hướng đầu ti¶n gồm phương ph¡p thông dụng là trø n·n, vèn phù hñp cho
c¡c ùng dụng thời gian thực. Tuy nhi¶n, trong nhi·u trường hñp, c¡c k¸t qu£ ph¡t hi»n
 9
H¼nh 3.2 V½ dụ c¡c quỹ đạo chuyºn động cõa người được t¤o ra tø li¶n k¸t quỹ đạo
cõa c¡c vị tr½ đểm ch¥n FootPoint tương ùng.
không hoàn ch¿nh (hëp bao chú nhªt không bao trọn cơ thº người) g¥y ra bởi nhi¹u
hay bóng. Nó làm gi£m độ ch½nh x¡c định vị. Hướng thù 2 xu§t hi»n ph¡t hi»n sai, hay
không ph¡t hi»n được đối tượng n¸u ta không có c¡c mô h¼nh được hu§n luy»n tèt.
Ngoài ra, c¡c phương ph¡p thuëc hướng ti¸p cªn này y¶u c¦u thời gian t½nh to¡n lớn
hơn, do đó không th½ch hñp với c¡c ti¸n tr¼nh thời gian thực. Ưu điểm cõa nó là c¡c
k¸t qu£ ph¡t hi»n đúng h¦u h¸t là k¸t qu£ hoàn thi»n (hëp chú nhªt bao trọn người)
và có thº ph¡t hi»n người khi không di chuyºn hay người bị che khu§t mët ph¦n.
 Để x¥y dựng mët bë ph¡t hi»n người hi»u qu£ cho định vị trong h» thèng gi¡m
s¡t thời gian thực, chúng tôi đề xu§t mët sè c£i ti¸n sau:
 ˆ K¸t hñp Adaptive GMM [25] với HOG-SVM [8] nh¬m tªn dụng ưu điểm cõa tøng
 phương ph¡p.
 ˆ Đề xu§t mët phương ph¡p khû bóng hi»u qu£ nh¬m c£i thi»n k¸t qu£ ph¡t hi»n
 người, tø đó c£i thi»n hi»u qu£ cõa c¡c bước ti¸p theo trong định vị và định danh
 l¤i người.
 - Theo v¸t người: Theo v¸t được thực hi»n dựa tr¶n c¡c k¸t qu£ ph¡t hi»n. Như
đã n¶u trong ph¦n c¡c công tr¼nh có li¶n quan, méi phương ph¡p theo v¸t có ưu, nhược
điểm ri¶ng. Tuy nhi¶n, đối với c¡c ùng dụng mà môi trường không qu¡ phùc t¤p như
trong trường hñp chúng tôi xem x²t, bë lọc Kalman [24] là lựa chọn phù hñp với mët
sè lñi ½ch sau:
 ˆ D¹ t½nh to¡n và triºn khai.
 ˆ Gi£m nhi¹u t¤o ra bởi c¡c ph¡t hi»n không ch½nh x¡c.
 ˆ Dự đoán vị tr½ cõa đối tượng trong trường hñp không ph¡t hi»n được đối tượng
 ở mët sè khung h¼nh.
 10
 ˆ Cho ph²p g¡n tøng đối tượng với quỹ đạo tương ùng.
Ngoài ra, trong nghi¶n cùu này, chúng tôi đề xu§t sû dụng gi£i thuªt g¡n dú li»u cùng
với bë lọc Kalman nh¬m c£i thi»n hi»u qu£ theo v¸t đối tượng.
 - Định vị và li¶n k¸t c¡c quỹ đạo chuyºn động cõa người: Để định vị người
tr¶n h» tọa độ th¸ giới thực, c¡c bước sau được thực hi»n:
 ˆ Định nghĩa mët b£n đồ 2D cõa mặt sàn nơi người di chuyºn. B£n đồ này chùa
 t§t c£ c¡c trường quan s¡t camera.
 ˆ T½nh to¡n c¡c tọa độ cõa tøng vị tr½ ch¥n người tr¶n b£n đồ 2D dựa tr¶n kỹ
 thuªt hi»u ch¿nh camera và bi¸n đổi hormography.
C¡c quỹ đạo cõa tøng người qua c¡c camera được li¶n k¸t với nhau nhờ nèi nhi·u
trường quan s¡t camera dựa tr¶n kỹ thuªt hi»u ch¿nh stereo.
 - Định danh l¤i người: Trong ngú c£nh cõa h» thèng gi¡m s¡t thời gian thực,
khi mët người xu§t hi»n l¦n đầu trong mët trường quan s¡t camera, c¦n ch¿ ra vị tr½ và
danh t½nh tương ùng cõa người đó. Thông tin này sau đó s³ được cªp nhªt li¶n tục ở
c¡c chuéi khung h¼nh ti¸p theo khi người di chuyºn trong mët trường quan s¡t camera,
hay dịch chuyºn tø mët trường quan s¡t này sang trường quan s¡t kh¡c. Vi»c cªp nhªt
danh t½nh người trong m¤ng camera được gọi là định danh l¤i. Đóng góp cõa luªn ¡n
cho bài to¡n định danh l¤i người trong m¤ng camera được tr¼nh bày ở chương 5.
3.2 C¡c cơ sở dú li»u thû nghi»m
 Để đánh gi¡ hi»u qu£ cõa c¡c phương ph¡p đề xu§t cho định vị và định danh
người trong h» thèng gi¡m s¡t nhi·u camera, mët sè cơ sở dú li»u mới được x¥y dựng
cho mët môi trường táa nhà cụ thº với c¡c ngú c£nh gi¡m s¡t thời gian thực được xem
x²t.
3.3 Khû bóng
 Trong nghi¶n cùu này, chúng tôi đề xu§t mët phương ph¡p khû bóng hi»u qu£.
Phương ph¡p gồm sơ đồ k¸t hñp score dựa tr¶n mªt độ ph¥n bè x¡c su§t, cùng với
phương ph¡p học được ¡p dụng cho khû bóng. Hai kiºu đặc trưng kh¡c nhau trong
vùng bóng đưñc tr½ch chọn. Đó là đặc trưng chromaticity và đặc trưng vªt lý. Hai l¥n
lªn hay score bóng được t½nh to¡n tø c¡c đặc trưng này. Mët tỷ l» l¥n cªn là mët score
bóng hay không bóng được t½nh to¡n. C¡c x¡c su§t cõa bóng và không bóng được ước
lượng dựa tr¶n cơ sở c¡c ph¥n bè x§p x¿ cõa c¡c score bóng sû dụng GMM.
 11
3.3.1 Tr½ch chọn đặc trưng Chromaticity và t½nh to¡n score bóng
3.3.2 T½nh to¡n score bóng sû dụng đặc trưng vªt lý
3.3.3 Sơ đồ k¸t hñp score dựa tr¶n hàm mªt độ ph¥n bè x¡c su§t bóng
 Sơ đồ này được x¥y dựng dựa tr¶n sơ đồ k¸t hñp score trong [17]. Coi s = (s1; s2)
là biºu di¹n score hai thành ph¦n s1 và s2 được t½nh to¡n tø 3.3.1 và 3.3.2. Ph²p thû
tèi ưu cho ph²p g¡n mët vector score s cho lớp shadow hay nonshadow là ph²p thû
tỷ l» l¥n cªn fshadow(s)=fnonshadow(s), với fshadow(s) và fnonshadow(s) là c¡c hàm mªt đë
cõa dú li»u hu§n luy»n bóng và không bóng. C¡c ước lượng fshadow(s) và fnonshadow(s)
là c¡c hén hñp Gauss.
Gi£i thuªt 1: Shadow pixel separation
Input: image I and a threshold ζ
Output: shadow pixels SD
Initialize an empty set SD;
for pixel pi in image I with the estimates of fshadow and fnonshadow do
 Calculate fshadow, fnonshadow by Equations 3.3.1 and 3.3.2;
 L = fshadow=fnonshadow;
 if L > ζ then
 SD = SD [ fpig
 end
end
return (SD);
3.3.4 Đánh gi¡ thû nghi»m
 H¼nh 3.3 thº hi»n k¸t qu£ khû bóng khi ¡p dụng phương ph¡p đề xu§t và c¡c
phương ph¡p kh¡c trong [20].
 100
 90
 80
 70
 60
 50
 40
 30
 20
 Shadow Removal Performance (%) Performance Removal Shadow 10
 0
 Physics Chromaticity SR Texture Geometry LR Texture Proposed
 method
 Detection rate Discrimination rate
H¼nh 3.3 C¡c k¸t qu£ khû bóng khi ¡p dụng phương ph¡p đề xu§t và c¡c phương ph¡p
kh¡c trong [20].
 12
3.4 Ph¡t hi»n người
3.4.1 K¸t hñp trø n·n và HOG-SVM
Gi£i thuªt 2: Fusion of adaptive GMM and HOG-SVM for human detection
Input: image I
Output: human ROI
Initialize an empty set ROI
ROIGMM = adaptiveGMM (I );
if ROIGMM 6= ; then
 for ROIi in ROIGMM do
 ROIext = extend(ROIi);
 ROIHOG = HOGSVM (ROIext);
 for ROIj in ROIHOG do
 if ROIj = ; then
 ROI = ROI [ fROIig;
 else
 ROI = ROI [ fROIjg;
 end
 end
 end
else
 ROI = HOGSVM (I );
end
return (ROI );
 Trong nghi¶n cùu này, chúng tôi đề xu§t sû dụng k¸t hñp GMM th½ch nghi [22]
và HOG-SVM [8] cho ph¡t hi»n người. Vi»c k¸t hñp này cho ph²p ph¡t huy được ưu
điểm t½nh to¡n nhanh cõa GMM và kh£ n«ng t¡ch người tèt cõa HOG-SVM. GMM
th½ch nghi phù hñp với c¡c ùng dụng thời gian thực, tuy nhi¶n trong trường hñp có
nhi·u người đùng c¤nh nhau hay bị che khu§t, GMM không thº ph¡t hi»n t¡ch bi»t
tøng người. Chúng ta có thº kh­c phục ph¦n nào h¤n ch¸ này cõa GMM b¬ng c¡ch ¡p
dụng bë ph¡t hi»n người HOG-SVM. Tuy nhi¶n, thời gian t½nh to¡n HOG-SVM nhi·u
hơn so với h¦u h¸t c¡c gi£i ph¡p trø n¶n. Vi»c k¸t hñp hai kỹ thuªt nh¬m đạt đồng
thời hai mục đích cho ph¡t hi»n người là độ ch½nh x¡c và y¶u c¦u thời gian thực.
 Gi£i thuªt 2 thº hi»n k¸t hñp GMM th½ch nghi với HOG-SVM cho ph¡t hi»n người.
3.4.2 Đánh gi¡ thû nghi»m
3.4.2.1 Cở sở dú li»u và c¡c ti¶u ch½ đánh gi¡
 Để sû dụng bë ph¡t hi»n HOG-SVM hi»u qu£ trong môi trường thû nghi»m, chúng
tôi sû dụng cơ sở dú li»u MICA1 và INRIA [8] cho hu§n luy»n bë mô t£ HOG. Dú li»u
 13
MICA2 được dùng cho pha thû nghi»m HOG-SVM. Trong nghi¶n cùu này, chúng tôi
x¡c định giới h¤n cực đại 120×300 pixels và cực tiºu 25×80 cho vùng ROI chùa người.
Bë mô t£ HOG trong thư vi»n OpenCV có độ ph¥n gi£i chu©n hóa cho £nh ROI là
64×128.
3.4.2.2 C¡c k¸t qu£ thû nghi»m
 B£ng 3.1 thº hi»n c¡c k¸t qu£ so s¡nh khi ¡p dụng phương ph¡p HOG-SVM và
k¸t hñp HOG-SVM với GMM th½ch nghi. Hi»u qu£ cõa phương ph¡p khû bóng đề xu§t
(được tr¼nh bày trong 3.3) đối với ph¡t hi»n người cũng được đánh gi¡ trong ph¦n
này. C¡c thû nghi»m được ti¸n hành ở 3 ngú c£nh mët người, hai người và ba người di
chuyºn tr¶n cùng mët hành tr¼nh. Trong trường hñp hai và ba người di chuyºn, xu§t
hi»n c¡c t¼nh huèng th¡ch thùc v· che khu§t giúa người với người và hi»n tượng bóng
phùc t¤p.
B£ng 3.1 Hi»u qu£ ph¡t hi»n người sû dụng HOG-SVM, k¸t hñp HOG-SVM với GMM
th½ch nghi ¡p dụng và không ¡p dụng khû bóng tr¶n dú li»u MICA2.
 Precision (%) Recall (%)
 Methods
 One person Two people Three people One person Two people Three people
HOG-SVM 67.13 58.17 47.97 52.11 44.63 38.92
HOG-SVM+Adaptive GMM without SR 84.49 71.52 64.62 70.05 62.49 51.29
HOG-SVM+Adaptive GMM with SR 92.13 83.27 76.31 82.17 70.04 63.87
3.5 Theo v¸t và định vị người
3.5.1 Bë lọc Kalman
3.5.2 Theo v¸t người và li¶n k¸t dú li»u
3.5.3 Định vị và li¶n k¸t quỹ đạo người trong m¤ng camera
3.5.3.1 Định vị người
 Để định vị người trong h» tọa độ th¸ giới thực, chúng tôi định nghĩa mët b£n
đồ 2D cõa mặt sàn nơi người di chuyºn. B£n đồ này chùa t§t c£ c¡c trường quan s¡t
camera, và c¡c quỹ đạo chuyºn động cõa người trong h» tọa độ th¸ giới thực s³ được
hiºn thị trong b£n đồ này. C¡c bước sau đây được đề xu§t cho định vị tr¶n h» tọa độ
th¸ giới thực:
 ˆ Hi»u ch¿nh camera
 ˆ Chèng m²o khung h¼nh.
 ˆ Chuyºn tọa độ £nh cõa c¡c vị tr½ FootPoint sang c¡c vị tr½ tr¶n h» tọa độ th¸ giới
 thực.
 14
3.5.3.2 Li¶n k¸t c¡c quỹ đạo người trong m¤ng camera
 Li¶n k¸t quỹ đạo người trong m¤ng camera li¶n quan tới ti¸n tr¼nh cªp nhªt vị tr½
và ID tương ùng khi người dịch chuyºn tø mët trường quan s¡t cõa camera này sang
c¡c trường quan s¡t cõa c¡c camera kh¡c. Dựa tr¶n gi£ thi¸t t§t c£ đối tượng đều di
chuyºn tr¶n mët mặt ph¯ng sàn duy nh§t có chùa c¡c camera quan t¥m, và b¬ng c¡ch
chuyºn c¡c vị tr½ FootPoint tr¶n tọa độ £nh sang tọa độ th¸ giới thực cõa mặt ph¯ng
sàn 2D, chúng ta có thº li¶n k¸t c¡c quỹ đạo người tø c¡c camera kh¡c nhau và biºu
di¹n c¡c hành tr¼nh cõa người tr¶n mët mặt ph¯ng duy nh§t. Để thực hi»n, chúng tôi
đề xu§t mët phương ph¡p hi»u qu£ cho ph²p k¸t nèi c¡c quỹ đạo chuyºn động cõa
người tø c¡c camera kh¡c nhau. Phương ph¡p dựa tr¶n cơ sở nèi nhi·u trường quan
s¡t camera b¬ng kỹ thuªt hi»u ch¿nh stereo.
3.5.3.3 C¡c k¸t qu£ thû nghi»m
 C¡c thû nghi»m được thực hi»n và đ¡nh gi¡ ở 3 trường quan s¡t kh¡c nhau cõa
Cam 1 (c£nh ở s£nh táa nhà), Cam 2 (c£nh hành lang táa nhà) và Cam 4 (c£nh trong
pháng showroom). Dú li»u MICA2 với c¡c c£nh hai người di chuyºn qua c¡c trường
quan s¡t camera được xem x²t trong c¡c đánh gi¡ thû nghi»m.
3.6 K¸t luªn
 H» thèng định vị người được thû nghi»m tr¶n mët mặt ph¯ng sàn nhi·u camera.
C¡c điều ki»n chi¸u s¡ng kh¡c nhau và sự che khu§t được xem x²t. C¡c k¸t qu£ thû
nghi»m là có triºn vọng, tuy nhi¶n, trong thời gian tới, c¡c t¼nh huèng phùc t¤p cõa
theo v¸t nhi·u người trong đám đông n¶n đưñc xem x²t đánh gi¡.
 CHƯƠNG 4
ĐỊNH DANH VÀ ĐỊNH DANH LẠI NGƯỜI TRONG
 MẠNG CAMERA
 Như đã tr¼nh bày trong ph¦n Giới thi»u, c¡c phương ph¡p đề xu§t cho định vị và
định danh người được xem x²t trong ngú c£nh cõa h» thèng gi¡m s¡t người tự động
sû dụng nhi·u camera. Trong h» thèng này, trước khi người bước vào hoặc ra khỏi khu
vực gi¡m s¡t, người đó s³ được kiºm tra vào/ra nhờ h» thèng nhªn d¤ng mặt người.
Trong chương 3, vi»c g¡n định danh cho tøng vị tr½ ch¥n người FootPoint được thực
hi»n bởi ti¸n tr¼nh theo v¸t, và ta gọi đó là định danh b¬ng theo v¸t. Tuy nhi¶n, hi»n
tượng g¡n nh¦m định danh cho v¸t d¹ x£y ra khi người xu§t hi»n trở l¤i trong mët
trường quan s¡t camera hay khi người chuyºn tø mët vùng quan s¡t này sang vùng
quan s¡t kh¡c. Để có thº duy tr¼ đúng người theo quỹ đạo chuyºn động tương ùng, bài
to¡n định danh l¤i người trong ngú c£nh theo v¸t b¬ng định danh được đề xu§t trong
 15
chương này. Điều này có nghĩa là ở tøng vị tr½ FootPoint, ta thực hi»n tr½ch chọn vùng
£nh chùa người ROI và mët bë mô t£ được x¥y dựng cho vùng này. Ð khu vực kiºm
tra đầu vào, méi người trước khi di chuyºn vào vùng gi¡m s¡t s³ được h» thèng hu§n
luy»n b¬ng mët bë mô t£ người dựa tr¶n di»n m¤o, và qu¡ tr¼nh đối s¡nh để g¡n nh¢n
đối tượng được thực hi»n với tøng k¸t qu£ ph¡t hi»n người thu được trong vùng gi¡m
s¡t.
 Trong Chương 1, chúng tôi cũng đề cªp tới nhi·u hướng ti¸p cªn kh¡c nhau cho
bài to¡n định danh l¤i người trong m¤ng camera, trong đó c¡c phương ph¡p dựa tr¶n
di»n m¤o là thông dụng nh§t. Tuy nhi¶n, x¥y dựng được mët bë mô t£ người m¤nh
v¨n cán nhi·u th¡ch thùc. Trong nghi¶n cùu này, chúng tôi ti¸p cªn theo hướng x¥y
dựng bë mô t£ dựa tr¶n di»n m¤o, và đề xu§t ¡p dụng bë mô t£ hàm nh¥n KDES cho
định danh l¤i người trong m¤ng camera. Bë mô t£ này được giới thi»u l¦n đầu ti¶n bởi
[7] cho bài to¡n nhªn d¤ng đối tượng. Sau đó c¡c t¡c gi£ trong [18] đã thực hi»n mët
sè c£i ti¸n tr¶n bë mô t£ gèc và chùng minh t½nh hi»u qu£ cõa nó đối với bàn to¡n
nhªn d¤ng cû ch¿ tay. Bë mô t£ nh¥n KDES c£i ti¸n này s³ được ¡p dụng cho bài to¡n
định danh l¤i người trong nghi¶n cùu cõa chúng tôi.
4.1 Định danh người dựa tr¶n cở sở mặt người
4.1.1 Sơ đồ
4.1.2 Đánh gi¡ thû nghi»m
4.1.2.1 C¡c ngú c£nh thû nghi»m
4.1.2.2 C¡c ph²p đo
4.1.2.3 Dú li»u thû nghi»m và c¡c k¸t qu£
4.2 Định danh l¤i người dựa tr¶n cở sở di»n m¤o
4.2.1 Sơ đồ
 Sơ đồ h» thèng định danh l¤i người dựa tr¶n h¼nh £nh được đưa ra trong H¼nh 4.1,
gồm hai giai đoạn ch½nh là ph¡t hi»n và định danh l¤i người. Giai đoạn đầu đã được
 Human Detection Person Re-ID
 Input 
 ID
 Frames BGS with Shadow Feature 
 Detection Classification
 Removal Descriptor
 H¼nh 4.1 Sơ đồ h» thèng định danh l¤i người dựa tr¶n h¼nh £nh.
n¶u trước đó ở Chương 3 và dựa tr¶n c¡c k¸t qu£ ph¡t hi»n người, ở giai đoạn 2, định
danh người được thực hi»n dựa tr¶n bë mô t£ KDES m¤nh và mët bë ph¥n lớp. Bë
mô t£ đặc trưng được x¥y dựng dựa tr¶n c¡c đặc trưng được tr½ch chọn tø vùng ROI
người, sau đó ¡p dụng bë ph¥n lớp để học mô h¼nh người và dự đoán ID tương ùng.
 16
4.2.2 Bë mô t£ nh¥n c£i ti¸n cho di»n m¤o người
 Trong nghi¶n cùu này, 3 hàm nh¥n hướng, màu và c§u trúc được t¤o ra tø c¡c
thuëc t½nh pixel kh¡c nhau cõa hướng, màu, và c§u trúc. Với tøng nh¥n, tr½ch chọn
đặc trưng được thực hi»n ở 3 mùc: pixel, patch và toàn bë £nh. Vector đặc trưng cuèi
cùng được k¸t hñp tø 3 vector đặc trưng mùc £nh cõa hướng, màu, và c§u trúc.
 Sau khi t½nh to¡n bë mô t£ KDES, ¡p dụng bë ph¥n đa lớp SVM để hu§n luy»n
mô h¼nh cho tøng người. Đối với tøng m¨u ph¡t hi»n, mët danh s¡ch c¡c đối tượng
x¸p h¤ng được t¤o ra dựa tr¶n cơ sở c¡c x¡c su§t cõa lớp tr£ v· bởi ph¥n lớp SVM.
4.2.3 C¡c k¸t qu£ thû nghi»m
4.2.3.1 C¡c cơ sở dú li»u thû nghi»m
 Trong nghi¶n cùu này, 7 cơ sở dú li»u chu©n được chọn để đánh gi¡ bë mô t£
KDES đề xu§t: CAVIAR4REID, i-LIDS, iLIDS-VID, ETH, RAiD, WARD, và HDA.
C¡c bë cơ sở dú li»u này phù hñp cho c¡c đánh gi¡ so s¡nh cõa định danh l¤i người
trong ngú c£nh gi¡m s¡t tự động hoàn toàn thời gian thực. C¡c bë cơ sở dú li»u này
đã được sû dụng trong c¡c nghi¶n cùu có li¶n quan [6], [9], [2], [21], [23] và [10]. Cơ
sở dú li»u MICA1 và MICA2 do chúng tôi x¥y dựng cũng được sû dụng trong c¡c thû
nghi»m định danh l¤i người.
 p
B£ng 4.1 C¡c cơ sở dú li»u sû dụng cho định danh l¤i người. Ký hi»u ( ) ở cët cuèi
b£ng thº hi»n mùc độ thay đổi trong mët lớp cõa c¡c cơ sở dú li»u.
 Release Tracking Intra-class
 Dataset # identities # cameras Label method Crop size Multi-shot
 time sequences Variation
 pp
ETHZ 1,2,3 2007 85,35,28 1 Hand Vary Yes Yes
 p
iLIDS 2009 69 1 Hand 128x64 Yes Yes
 ppp
CAVIAR4ReID 2011 72 2 Hand Vary Yes No
 ppp
WARD 2012 70 3 Hand 128x48 Yes Yes
 ppp
RAiD 2014 43 4 Hand 128x64 Yes No
 ppp
iLIDS-VID 2014 300 2 Hand Vary Yes Yes
 pppp
HDA 2014 78 13 Hand, Auto Vary Yes Yes
 pppp
MICA 1, 2 2015 25, 40 5, 3 Hand, Auto Vary Yes Yes
4.2.3.2 C¡c k¸t qu£ và bàn luªn
 B£ng 4.2 thº hi»n tóm t­t c¡c đánh gi¡ so s¡nh v· tỷ l» nhªn d¤ng Rank 1 tr¶n
c¡c bë cơ sở dú li»u thû nghi»m kh¡c nhau.
 17
B£ng 4.2 C¡c đánh gi¡ so s¡nh định danh l¤i người tr¶n Rank 1 (%) với c¡c phương
ph¡p và cơ sở dú li»u thû nghi»m kh¡c nhau (Ký hi»u "×" có nghĩa là không thực hi»n
thû nghi»m. Với dú li»u iLIDS, có hai thi¸t lªp thû nghi»m như mô t£ trong [6] và trong
[2].
 Rank1 recognition rate of different Person Re-ID methods (%)
 AHPE SDALF Direct Stein RDC PLS DVD Method in Original Proposed
 Datasets
 [6] [9] [2] [2] [21] [23] [10] KDES method
 CAVIAR4REID 8.2 x x x x x x 67.7 73.8
 iLIDS 37 42 37.8 x x x x x 57 64.2
 iLIDS 2 x 50 44 53.2 x x x 61.7 66.1
 ETHZ1 x x x x 79 x x 80 85
 ETHZ2 x x x x 74 x x 76.7 79.8
 ETHZ3 x x x x 77 x x 75.6 82.3
 WARD x x x x x x x 43.1 47.3
 RAiD x x x x x x x 50.2 54.1
 HDA, MANUALall x x x x x x 31.2 31 41.6
 HDA, MANUALclean x x x x x x 18.7 18.6 26.8
 HDA, FP ON OCC OFF x x x x x x 62.3 71.9 79.4
 HDA, FP OFF OCC ON x x x x x x 5.4 17.8 29.7
HDA, FP OFF OCC OFF x x x x x x 5.2 31.7 40.9
 HDA, FP ON OCC ON x x x x x x 66.7 57.6 70.9
 iLIDS-VID x x x x x 23.3 x 22.2 24.2
 MICA 1 x 30 x x x x x 67.1 73.1
4.3 K¸t luªn
 Trong chương này, chúng tôi xem x²t c¡c bài to¡n định danh và định danh l¤i
người trong h» thèng gi¡m s¡t người tự động hoàn toàn. Để kiºm so¡t người ra/vào
vùng gi¡m s¡t, chúng tôi đề xu§t sû dụng h» thèng nhªn d¤ng mặt người. Trong vùng
gi¡m s¡t nhi·u camera, bài đoán định danh l¤i người được gi£i quy¸t b¬ng mët bë mô
t£ KDES m¤nh. Hi»u qu£ cõa bë mô t£ di»n m¤o này được đánh gi¡ không ch¿ tr¶n
vùng ROI được tr½ch chọn thõ công mà c£ tự động hoàn toàn. Chúng tôi ch¿ ra r¬ng
c¡c k¸t qu£ ph¡t hi»n tự động đặt ra nhi·u th¡ch thùc hơn cho bài to¡n định danh l¤i
người trong m¤ng camera. H¦u h¸t c¡c cơ sở dú li»u đã có cho định danh l¤i người tªp
trung vào ph¡t hi»n thõ công, do đó, chúng tôi sû dụng k¸t qu£ ph¡t hi»n người tự
động tø dú li»u MICA2 cho c¡c thû nghi»m định danh l¤i, với c¡c ngú c£nh thực cõa
h» thèng gi¡m s¡t người tự động hoàn toàn.
 CHƯƠNG 5
 KẾT HỢP WIFI VÀ CAMERA CHO ĐỊNH VỊ VÀ
 ĐỊNH DANH NGƯỜI
 Trong nghi¶n cùu này, chúng tôi đề xu§t mët h» thèng k¸t hñp WiFi và camera
nh¬m t«ng lượng thông tin gi¡ trị cho định vị và định danh l¤i người. Vi»c k¸t hñp
nh¬m đạt được c¡c mục ti¶u sau:
 ˆ C£i thi»n hi»u qu£ theo v¸t và định danh l¤i người trong m¤ng camera. Chi ti¸t
 18
 s³ được tr¼nh bày ở c¡c ph¦n ti¸p theo.
 ˆ C£i thi»n chi ph½ t½nh to¡n: C¡c k¸t qu£ định vị thu được tø h» thèng WiFi được
 xem như k¸t qu£ thô đº k½ch ho¤t ti¸n tr¼nh định vị £nh ở c¡c camera thuëc vùng
 k¸t qu£ định vị tr£ v· tø h» thèng WiFi. Điều này giúp gi£m chi ph½ t½nh to¡n
 cõa h» thèng. Ch¿ có c¡c camera trong c¡c vùng định vị tr£ v· tø h» thèng WiFi
 s³ được xû lý cho định vị và định danh, c¡c camera kh¡c s³ không được k½ch ho¤t
 c¡c ti¸n tr¼nh này.
5.1 H» thèng k¸t hñp WiFi và camera cho định vị và định danh
 l¤i người
5.1.1 Sơ đồ
 Input sensors Unimodality Processing Multimodality Processing
 WiFi WiFi-based localization PW , ID W
 Fusion P, ID
 Camera 1 Vision-based localization
 PC , ID C
 Detection
 Tracking Identification
 Camera n &
 Localization Re-ID
H¼nh 5.1 Sơ đồ h» thèng định vị và định danh l¤i người sû dụng k¸t hñp WiFi và
camera.
 H¼nh 5.1 minh họa sơ đồ h» thèng t½ch hñp WiFi và camera cho định vị và định
danh l¤i người trong m¤ng camera.
5.1.2 Phương ph¡p k¸t hñp
 Gi£i thuªt 3 thº hi»n phương ph¡p k¸t hñp WiFi và camera cho định vị và định
danh người. Ð thời điểm t, tr¶n b£n đồ mặt sàn 2D, mët tªp c¡c quan s¡t vị tr½ tø h»
 w c
thèng WiFi (zi;t) hay camera (zj;t) cho nhi·u người được đưa ra. Ch¿ sè i là mët trong
sè N đối tượng đượ

File đính kèm:

  • pdfluan_an_nghien_cuu_va_phat_trien_cac_ky_thuat_dinh_vi_va_din.pdf