Luận án Nghiên cứu hệ thống chuyển động và điều khiển tay máy tự động thu hoạch dứa

Luận án Nghiên cứu hệ thống chuyển động và điều khiển tay máy tự động thu hoạch dứa trang 1

Trang 1

Luận án Nghiên cứu hệ thống chuyển động và điều khiển tay máy tự động thu hoạch dứa trang 2

Trang 2

Luận án Nghiên cứu hệ thống chuyển động và điều khiển tay máy tự động thu hoạch dứa trang 3

Trang 3

Luận án Nghiên cứu hệ thống chuyển động và điều khiển tay máy tự động thu hoạch dứa trang 4

Trang 4

Luận án Nghiên cứu hệ thống chuyển động và điều khiển tay máy tự động thu hoạch dứa trang 5

Trang 5

Luận án Nghiên cứu hệ thống chuyển động và điều khiển tay máy tự động thu hoạch dứa trang 6

Trang 6

Luận án Nghiên cứu hệ thống chuyển động và điều khiển tay máy tự động thu hoạch dứa trang 7

Trang 7

Luận án Nghiên cứu hệ thống chuyển động và điều khiển tay máy tự động thu hoạch dứa trang 8

Trang 8

Luận án Nghiên cứu hệ thống chuyển động và điều khiển tay máy tự động thu hoạch dứa trang 9

Trang 9

Luận án Nghiên cứu hệ thống chuyển động và điều khiển tay máy tự động thu hoạch dứa trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 169 trang nguyenduy 13/10/2025 30
Bạn đang xem 10 trang mẫu của tài liệu "Luận án Nghiên cứu hệ thống chuyển động và điều khiển tay máy tự động thu hoạch dứa", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

Tóm tắt nội dung tài liệu: Luận án Nghiên cứu hệ thống chuyển động và điều khiển tay máy tự động thu hoạch dứa

Luận án Nghiên cứu hệ thống chuyển động và điều khiển tay máy tự động thu hoạch dứa
nh được w ( )d t luận án tiến hành phân tích các thành 
phần của phương trình động lực học tay máy (2.33) và phương trình (2.57) để 
tìm được giới hạn trên của sai lệch mô hình w ( ) ( )d d dt G D t . 
Thành phần sai số trọng lực của mô hình 
Từ (2.33) và (2.57) nhận thấy thành phần trọng lực cũng có giới hạn trên 
bởi một hàm số dương được cho bởi phương trình (2.61) 
0 0 0
0 1
*
0 1
; 0
d d
d d
g g
d g
g g
d
G a a q
a
G a a q
 (2.61) 
nên 
 0 1 *
; 0g g gdG a a q a (2.62) 
với 
T
x y zq r r r là ma trận biến khớp. 
Thành phần nhiễu 
Theo các nghiên cứu [28], [29], [30] thì thành phần nhiễu ngẫu nhiên 
cũng luôn tồn tại giới hạn trên, tức: 
 0 0
( ) ; 0d ddD t a a 
(2.63) 
Từ các kết quả tại (2.61), (2.62), và (2.63) luận án có thể kết luận rằng 
mô hình w ( )d t cũng được giới hạn trên bởi một hàm dương sau: 
 0 1 2 *
w ( ) ; 0w w w wd t a a q a q a (2.64) 
 Tuy nhiên, trong thực tế chỉ có biến vị trí 
T
x y yq r r r là có thể đo 
được, còn biến gia tốc 
T
x y yq r r r là rất khó đo và nếu đo được thì sẽ có 
sai số lớn. Do vậy, tại các nghiên cứu [29], [31] đã ràng buộc (2.64) vào biến 
vị trí như sau: 
53 
 0 1w ( )
w w
d t b b q (2.65) 
với 
0 1,
w wb b là hằng số dương chưa biết. 
 Nếu đặt max(1, )q và 0 1
w wb b b thì: 
w ( )d t b (2.66) 
Trong (2.66) thì max(1, )q là giá trị đã biết thông qua biến khớp
T
x y yq r r r . 
2.6. Các thuật toán điều khiển đề xuất trong môi trường làm việc lý tưởng 
 Trong mục 2.5, mô hình động lực học lý tưởng của Robot 3DOF cho thu 
hoạch quả dứa được khảo sát trong 2 trường hợp: (1) Điều kiện làm việc lý 
tưởng và (2) khi làm việc tại thực nghiệm có tính đến độ nghiêng của bề mặt 
ruộng và chịu tác động của nhiễu. Trong giai đoạn thử nghiệm, hệ thống làm 
việc trong trường hợp lý tưởng có bề mặt phẳng, chuyển động thực tế của ba 
thanh nối Robot theo ba phương vuông góc của tọa độ Đề các. Phương trình 
động lực học trong trường hợp lý tưởng biểu diễn trong phương trình (2.27) 
như sau: 
0 0 0F H q G 
 Phương trình trên là cơ sở để phát triển các thuật toán điều khiển chuyển 
động cho tay máy robot thực hiện nhiệm vụ theo yêu cầu, cụ thể là đưa cơ cấu 
lồng cắt đến vị trí chính xác của quả dứa đã được nhận dạng và xác định tọa độ 
nhờ khối xử lý ảnh. 
 Trong mục này, một số thuật toán điều khiển cơ bản sẽ được đề xuất bao 
gồm: 
 - Thuật toán phi tuyến tựa mô hình; 
 - Thuật toán PD bù trọng trường; 
 - Thuật toán PID; 
 - Thuật toán Li-Slotine. 
54 
 Giả thuyết đặt ra là các thông số động học và động lực học của hệ thống 
là đã được xác định chính xác. 
2.6.1. Thuật toán phi tuyến tựa mô hình 
Hình 2.11. Mô hình điều khiển phi tuyến tựa mô hình 
Dựa trên mô hình động lực học hệ thống, thuật toán được đề xuất như 
sau: 
0F   (2.67) 
 Với 
0( )
( )
( ) ( )d p d d d
H q
G q
r K q q K q q


 (2.68) 
Thay phương trình (2.67; 2.68) vào (2.27), ta nhận được phương trình động lực 
học kín như sau: 
 0 0d P d D dH q q K q q K q q 
 Hay  0 0d PH e K e K e (2.69) 
 Với 
1
2
3
0 0
0 0
0 0
P
P P
P
K
K K
K
55 
 Và 
1
2
3
0 0
0 0
0 0
d
D d
d
K
K K
K
Là các ma trận đường chéo xác định dương do H0 là ma trận quán tính với tính 
chất là ma trận xác định dương, do vậy phương trình (2.69) thỏa mãn 
0d pe K e K e (2.70) 
Phương trình đặc tính của (2.70) là 
2 0d ps K s K (2.71) 
Do các tham số Kd và Kp là chọn nên có ba trường hợp xảy ra 
 a) Trường hợp 1: 
2 4 0d pK K 
Phương trình (2.71) có 2 nghiệm 
1
2
2 2
2 2
D
D
K
s
K
s
 (2.72) 
Hàm sai số có dạng như sau: 
1 2
1 1( )
s t s te t C e C e (2.73) 
Với C1, C2 là hằng số phụ thuộc điều kiện biên 
Hình 2.12. Nghiệm s1, s2 trong mặt phẳng phức khi >0 
Hàm sai số e trong miền thời gian có dạng như sau: 
Im{s} 
Re{s} 
s2 s1 
56 
Hình 2.13. Đồ thị sai số vị trí >0 
 b) Trường hợp 2: 
2 4 0p pK K 
Nghiệm kép của phương trình đặc tính có dạng như sau: 
1 2
2
DKs s (2.74) 
Hàm sai số 
1
2
1 2( )
s t
e t C C e
 (2.75) 
Hình 2.14. Nghiệm s1, s2 trong mặt phẳng phức khi =0 
Hình 2.15. Đồ thị sai số vị trí khi =0 
t 
e(t) 
Re{s
} 
Im{s
} 
s2s1 
e(0) 
r 
e(t) 
=0 
57 
 c) Trường hợp 3: 
2 4 0p pK K 
Hình 2.16. Nghiệm s1, s2 trong mặt phẳng phức khi <0 
Hình 2.17. Đồ thị sai số vị trí khi <0 
Nghiệm phức của phương trình đặc tính 
1
2
s i
s r i
 

 (2.76) 
Hàm sai số 
 1 2( ) cos( ) sin( )
t te t C e t C e t   (2.77) 
Có thể thấy trường hợp tối ưu là chọn tham số thỏa mãn 
2D pK K (2.78) 
Đây là một phương pháp điều khiển hữu hiệu trong trường hợp mô hình động 
lực học giả định có nhiều ngoại lực tác động lên hệ thống. Việc lựa chọn các 
tham số điều khiển phù hợp sẽ đảm bảo các sai số quỹ đạo tiệm cận về 0. Tuy 
nhiên, phương pháp này có nhược được là khá phức tạp về mặt toán học, dẫn 
Re{s} 
Im{s
} 
s1 
s2 
e(t) 
r 
e(0) 
58 
đến việc thực nghiệm sẽ trở nên khó khăn. Vì vậy, cần một thuật toán khả thi 
hơn. 
2.6.2. Phương pháp momen tính toán (PD-bù trọng trường) 
 Thuật toán momen tính toán được đề xuất như sau: 
 0 0
( ) ( )p d dF K q q K q G q (2.79) 
 Thay (2.79) vào phương trình (2.27), ta có 
 0 p d
H q K e K q (2.80) 
Nhân cả 2 vế (2.80) với Tq , ta có 
 0
T T T
p dq H q q K e q K q (2.81) 
Rõ ràng: 0( )
T T T
P d
d
q H q e K e q K q
dt
 (2.82) 
Nếu chọn hàm Lyapunov như sau: 
 0
( , ) T T pV q e q H q e K e (2.83) 
Rõ ràng 
0
( , ) 0, ( , ) 0
0
q
V q e V q e
e
 (2.84) 
 0, ( ) 0 0
T
dV q K q V q q  (2.85) 
Thay vào phương trình (2.80), ta có 
 0de q q khi t (2.86) 
Rõ ràng, thuật toán đề xuất đảm bảo sai số quỹ đạo sẽ tiến tới 0. 
59 
Hình 2.18. Mô hình điều khiển theo phương pháp momen tính toán 
Có thể thấy phương pháp trên đã khắc phục được nhược điểm của momen tính 
toán, nhưng vẫn còn thành phần G0 phụ thuộc mô hình cần phải xác định chính 
xác. Nếu không xác định chính xác, sai số tĩnh có thể tồn tại. 
2.6.3. Phương pháp PID 
Để khắc phục sai số tĩnh, phương pháp momen tính toán được cải tiến 
bằng cách bỏ sung khâu tích phân như sau: 
 0 0( ) ( )p d d I dF K q q K q K q q dt G (2.87) 
Hình 2.19. Sơ đồ điều khiển phương pháp PID 
60 
2.6.4. Giải thuật Li-Slotine 
Hình 2.20. Mô hình điều khiển Li-Slotine 
Li-Slotine đã đề xuất thuật toán điều khiển như sau: 
 0 0 0( )DF H v K r G q (2.88) 
Với 
( )d dv q q q
r v q e e


 (2.89) 
Thay phương trình (2.88) vào phương trình (2.27) 
 0
( ) pH v q K r (2.90) 
Tức là 
0 pH r K r (2.91) 
Nhân cả 2 vế (2.91) với rT, ta có 
0
T T
D
d
r H r r K r
dr
 (2.92) 
Chọn hàm Lyapunov như sau 
2 0
1
( )
2
TV r r H r (2.93) 
 Rõ ràng 
2 2
2
( ) 0, ( ) 0 0
( ) 0, ( ) 0 0
V r V r r
V r V r r
 (2.94) 
 Có nghĩa là 
0r e e 
61 
Hay 
0
0
d
d
e q q
e q q
Do vậy có thể kết luận thuật toán Li-Slotine đảm bảo sai số quỹ đạo về 0 
Nhận xét: 
 Các phương pháp điều khiển trên đều đảm bảo sai số quỹ đạo về 0. Tuy 
nhiên, các phương pháp đều dựa trên mô hình động lực học lý tưởng và môi 
trường làm việc không có nhiễu. Trên thực tế, bề mặt ruộng dứa không bằng 
phẳng, hệ thống nghiêng so với hệ tọa độ gốc các góc ,,tương ứng. Các 
nhiễu tác động lên trục động cơ có thể kể đến là ma sát trong ở trục, tác động 
của gió, trễ của đáp ứng cảm biến... Những yếu tố đó làm các thuật toán điều 
khiển trên không còn chính xác. Do vậy, cần thiết phải phát triển các thuật toán 
có tính bền vững hơn, có khả năng ước lượng và bù nhiễu. 
Kết luận chương 2 
 Từ kết quả thu được, luận án rút ra một số kết luận sau: 
1. Luận án đã xây dựng được mô hình, thiết lập được phương trình động 
học ngược để xác định lượng dịch chuyển của các khớp tay máy robot, đã xây 
dựng được mô hình động lực học tay máy trong các trường hợp lý tưởng và 
trường hợp thực tế thông qua phương pháp Euler-Lagrange. 
2. Đã quy đổi hai mô hình động lực học về đầu trục động cơ truyền động 
cho hai khớp, việc quy đổi này phục vụ cho bài toán điều khiển chuyển động 
của tay máy thu hoạch dứa vì hệ thống truyền động của khớp 1 và 2 tay máy là 
dẫn động bằng động cơ điện. 
 3. Đã xác định được mô hình động lực học thực tế của tay máy thông qua 
mô hình động lực học lý tưởng. Từ đó làm cơ sở khoa học cho việc xây dựng 
được phương trình điều khiển chuyển động tay máy dựa trên mô hình động lực 
học được trình bày tại chương 3. Thông qua phân tích đặc điểm của sai số mô 
62 
hình để khẳng định sai số mô hình ( w ( )d t ) có giới hạn trên, kết quả này là tiền 
đề cho việc ước tính giới hạn trên của sai số mô hình (trình bày tại chương 3). 
 Đây là điểm đóng góp mới của luận án, làm cơ sở lý luận để xây dựng 
chương trình điều khiển và tiến hành chế tạo hệ thống điều khiển phần cứng 
cho liên hơp máy thu hoạch dứa tự động được chế tạo trong đề tài cấp nhà nước 
(mã số KHCN-TNB/14-19/C30). 
63 
Chương 3 
ĐIỀU KHIỂN CHUYỂN ĐỘNG TAY MÁY THU HOẠCH DỨA 
TỰ ĐỘNG 
Từ phân tích nguyên lý hoạt động của tay máy tự động thu hoạch dứa tại 
mục 2.1.2, thì bước 1 là bước cần phải điều khiển chính chuyển động tay máy 
chính xác, vì kết quả chuyển động tay máy tại bước này quyết định tới việc tay 
máy có hạ đúng vị trí quả dứa cần cắt hay không. Do vậy, tại chương 3 luận án 
tiến hành nghiên cứu phương pháp điều khiển chuyển động tay máy cho bước 
1. Các bước 2 và bước 3 tay máy hoạt động theo nguyên tắc logic với các tín 
hiệu được phản hồi về hệ thống điều khiển thông qua các cảm biến hành trình 
được gắn trên khung công tác. Nội dung nghiên cứu của chương 3 bao gồm các 
nội dung sau: 
- Luận án tiến hành nghiên cứu bài toán nhận diện quả dứa cần thu hoạch, 
tức phân biệt quả dứa xanh (bao gồm cả trái non, trái xanh chưa chín) và quả 
dứa chín. Từ đó luận án tiến hành nghiên cứu việc xác định tọa độ quả dứa cần 
thu hoạch (quả dứa chín), xác định tọa độ ( , ,c c cx y z ) là đầu vào để giải bài toán 
động học ngược tại phương trình (2.3) và (2.4) để xác định khoảng di chuyển 
của tay máy ( , ,x y zr r r ). 
- Luận án tiến hành xây dựng phương trình điều khiển chuyển động tay 
máy, với mục đích tính được mômen cần thiết đặt trên hai trục động cơ (chính 
là mômen mà động cơ cần tạo ra) để các khớp dịch chuyển quãng đường cần 
thiết ( ,x yr r ), đưa tay máy đến đúng vị trí quả dứa cần thu hoạch. 
- Kiểm tra tính đúng đắn của mô hình động lực học chuyển động (chương 
2) và bài toán điều khiển chuyển động (tại chương 3), luận án sử dụng phần 
mềm Matlab để tiến hành quá trình mô phỏng, với chương trình Matlab được 
viết dựa trên phương trình động lực học (chương 2) và thuật toán điều khiển 
chuyển động (chương 3). 
64 
3.1. Nhận diện quả dứa cần thu hoạch 
Để xác định được quãng đường dịch chuyển của tay máy giải được bài 
toán động học ngược (2.3) và (2.4), là đầu vào của bài toán điều khiển chuyển 
động tay máy. Luận án tiến hành nghiên cứu việc nhận diện quả dứa cần thu 
hoạch, sau đó xây dựng thuật toán tính toạ độ quả dứa đó so với vị trí đặt camera 
trên khung công tác. 
Trong lớp các bài toán nhận diện ảnh, bài toán nhận diện quả dứa và phân 
loại quả dứa xanh chín được xếp vào nhóm bài toán nhận diện vật thể. Đặc 
điểm chung của những bài toán nhận diện vật thể là một bức ảnh chứa nhiều 
vật thể thuộc nhiều lớp (class) khác nhau. Nhiệm vụ của bài toán là phải đưa ra 
danh sách tất cả các vật thể thuộc những lớp được chỉ định trong bức ảnh đó, 
bao gồm thông tin về toạ độ, lớp của vật thể. Toạ độ của vật thể thường là thông 
tin hình chữ nhật bao quanh vật thể đó, hình chữ nhật này có các cạnh song 
song với các viền của ảnh. 
Có nhiều phương pháp giải quyết bài toán nhận diện vật thể khác nhau. 
Có thể xếp các phương pháp này vào 2 nhóm: 
- Giải quyết theo cơ chế đường ống (pipeline): phát hiện -> phân loại. 
Nhóm bài toán này sẽ tìm cách phân tách các vật thể trong một bức ảnh thành 
các bức ảnh độc lập, sau đó phân loại những bức ảnh đó một cách độc lập. 
Những giải thuật tiêu biểu là: R-CNN, Fast R-CNN. 
 - Giải quyết theo cơ chế end-to-end: sử dụng một mô hình duy nhất để 
giải quyết đồng thời cả bài toán phân loại và bài toán xác định vị trí. Thuật toán 
tiêu biểu có thể kể đến là YOLO, SSD,... 
3.1.1. Thuật toán YOLO 
YOLO (You Only Look Once) là thuật toán deep learning giải quyết bài 
toán nhận diện vật thể. Hiện tại, phiên bản mới nhất của thuật toán này là 
YOLOv3. Nguyên lý chung của thuật toán YOLOv3. 
65 
Huấn luyện một mạng CNN duy nhất để giải quyết cả bài toán nhận diện 
và bài toán phân loại. Đầu vào của mạng CNN là một bức ảnh, đầu ra là danh 
sách các vật thể (bao gồm thông tin toạ độ với lớp); 
Chia hình ảnh thành một lưới có kích thước MxM ô, mỗi ô này được gọi 
là 1 grid cell. Mỗi grid cell này dự đoán chính xác B hình bao, bao gồm thông 
tin vị trí, kích thước và xác suất mà nó chứa vật thể thuộc 1 trong các lớp chỉ 
định; 
Kích thước các hình bao có một giá trị mặc định, gọi là anchor box. Kết 
quả của mạng CNN là độ lệch của hình bao thực sự so với giá trị mặc định. Ý 
tưởng này xuất phát từ nhận xét rằng, với một bộ dữ liệu nhất định, kích thước 
các vật thể thường không khác nhau quá nhiều. Việc khởi tạo một giá trị mặc 
định như vậy giúp quá trình huấn luyện mạng CNN diễn ra nhanh hơn, do nếu 
dự đoán sai, thuật toán tối ưu sẽ điều chỉnh để mạng có xu hướng dự đoán kích 
thước hình bao gần với giá trị mặc định hơn; 
Sử dụng score và IoU để loại đi những vật thể không thực sự tồn tại hoặc 
trùng lặp. Do YOLO có MxM grid cells và mỗi grid cell luôn dự đoán chính 
xác B hình bao, bất kể có vật thể hay không, nên sẽ có nhiều hình bao không 
thực sự chứa vật thể nào. Vì vậy, đầu ra của mạng phải chứa thêm điểm số - 
biểu diễn khả năng hình bao chứa một lớp vật thể nào đó. Điểm số này phải lớn 
hơn một ngưỡng nhất định để ta quyết định rằng hình bao đó chứa vật thể. 
Ngoài ra, với những cặp hình bao có IoU (tỉ lệ diện tích phần giao chia cho 
phần hợp), ta cũng cần loại bỏ hình bao có score thấp hơn, do mô hình đã dự 
đoán lặp lại một vật thể. 
Tác giả của thuật toán YOLOv3 đã tạo ra kiến trúc mạng Darknet để áp 
dụng cho giải thuật của mình. Thông số kiến trúc dark-net-53 được tải tại địa 
chỉ: https://github.com/pjreddie/darknet/blob/master/cfg/darknet53.cfg. Đồng 
thời, tác giả cũng cung cấp bộ trọng số đã được huấn luyện của kiến trúc này 
tại địa chỉ: https://pjreddie.com/media/files/darknet53.conv.74. 
66 
3.1.2. Nghiên cứu nhận diện quả dứa 
3.1.2.1. Xây dựng cơ sở dữ liệu ảnh gốc thông qua quá trình thực nghiệm 
- Địa điểm: Cánh đồng dứa tại tỉnh Tiền Giang. 
- Thời gian: Từ 8h00 đến 17h00 các ngày. 
- Thiết bị: Máy ảnh Intel RealSence Depth Camera D435. 
- Phương pháp chụp ảnh: 
+ Sử dụng mô hình mẫu máy cắt dứa hình lập phương, kích thước 1,1m 
x2.4mx1,5m. Gắn camera ở giữa khung công tác (hình 2.1). Góc chụp của 
camera so với phương nằm ngang được xác định trước sao cho có thể nhìn được 
toàn bộ các quả dứa có trong khung công tác, góc chụp được giữ cố định trong 
quá trình lấy mẫu và quá trình thu hoạch sau này (góc chụp được xác định là 
40 độ thì đảm bảo camera nhìn thấy hết toàn bộ các quả dứa trong phạm vi 
khung công tác). 
+ Camera được điều khiển và trả về dữ liệu cho máy tính qua cổng kết 
nối USB type C. Ảnh trả về bao gồm 1 ảnh JPEG có độ phân giải 1280x720 và 
1 ảnh độ sâu. 
Hình 3.1. Dữ liệu ảnh thu thập được đại diện cho 5000 bức ảnh mẫu 
67 
3.1.2.2. Gán nhãn dữ liệu 
- Công cụ gán nhãn được tải trên địa chỉ 
https://github.com/tzutalin/labelImg. 
- Trên từng ảnh thực hiện việc gán nhãn (vẽ box hình vuông, công cụ vẽ 
tải từ địa chỉ trên) tới mọi bộ phận được nhận biết bằng mắt thường trên trái. 
- Với từng quả dứa được đánh nhãn sẽ được gán tên nhãn tương ứng. Có 
3 loại dứa cần dán gồm: dứa non (baby pineapple) có đặc điểm nhận dạng là 
kích thước bé, màu đỏ ở phần mắt vỏ trái và vương miện, thân quả màu xanh 
đậm, phần vương miện bé; dứa xanh (green pineapple) có đặc điểm nhận dạng 
là kích thước vừa, thân có màu xanh đậm, phần vương miện lớn nhưng không 
xòe ra; dứa chín (ripe pineapple) có đặc điểm nhận dạng là kích thước lớn, thân 
có màu vàng, phần vương miện lớn và xòe ra. 
- Với mỗi quả dứa ta đánh dấu 3 box: thân quả (body), vương miện 
(crown) và toàn bộ quả (full). Do đó có 9 nhãn cho các box: full baby pineapple, 
full green pineapple, full ripe pineapple, crown baby pineapple, crown green 
pineapple, crown ripe pineapple, body baby pineapple, body green pineapple, 
body ripe pineapple. 
Hình 3.2. Kết quả gán nhãn 
Kết quả: Sau khi gán nhãn xong, ta sẽ thu được 1 bộ cơ sở dữ liệu gồm 
68 
ảnh chứa các đối tượng được đánh nhãn, đi kèm với mỗi 1 ảnh là 1 file chứa 
thông tin của các đối tượng được đánh nhãn trên cùng 1 bức ảnh, thông tin bao 
gồm: đường dẫn đến mục chứa các ảnh sau khi gán nhãn, kích thước của toàn 
bộ khung ảnh, tên lớp đã gán tên cho đối tượng, tọa độ 4 điểm của khung đã 
khoanh vùng đối tượng. 
Hình 3.3. Kết quả thể hiện việc gán nhãn cho đối tượng là quả dứa của 
luận án 
3.2. Huấn luyện nhận diện quả dứa cho máy tính 
- Sử dụng dịch vụ Google Colab của Google để đào tạo mô hình 
69 
Google Colab. Đây là một dịch vụ đám mây miễn phí của Google nhằm hỗ 
trợ cộng đồng nghiên cứu AI phát triển các ứng dụng deep learning bằng 
việc cung cấp GPU và TPU miễn phí). 
- Cầu hình máy tính cần sử dụng: GPU Tesla K80, 12 GB RAM 
- Môi trường: Python 3, Keras 2.1.5, Tensorflow 1.6.0 
- Code huấn luyện được tham khảo tại đường link: 
https://github.com/qqwweee/keras-yolo3 
- Luận án sử dụng 3 lần huấn luyện gồm: 
3.2.1. Huấn luyện nhận diện quả dứa (lần 1) 
Lần huấn luyện này để nhận diện quả dứa tổng quát, không phân biệt trái 
non, trái xanh và trái chín. Do vậy, nhóm 3 nhãn full ripe pineapple (nhãn toàn 
bộ quả dứa chín, nhãn bao cả thân và vương miện dứa), full green pineapple 
(nhãn toàn bộ quả dứa xanh), full baby pineapple (nhãn toàn bộ quả dứa non) 
thành 1 nhãn full pineapple (nhãn toàn bộ quả dứa chung, gồm cả thân và vương 
miện dứa). Mục đích của việc huấn luyện này để máy tính có khả năng nhận 
diện được đặc điểm chung của một quả dứa, nhằm phân biệt quả dứa với các 
loại hoa quả khác (cam, bưởi, ổivv). 
- Bộ trọng số cơ sở: Sử dụng bộ trọng số pre-trained của mạng 
darknet53 (https://pjreddie.com/media/files/darknet53.conv.74). 
- Bước 1: Đóng băng các lớp đầu và huấn luyện 2 lớp cuối qua 120 
epochs với learning rate là 1e-3 để đạt được trạng thái ổn định của loss. 
- Bước 2: Huấn luyện toàn mạng qua 60 epoch với learning rate ban 
đầu là 1e-4 (sử dụng thuật toán ReduceLROnPlateau để thay đổi learning 
rate trong quá trình huấn luyện). 
70 
Hình 3.4. Đoạn code cho thuật toán chương trình huấn luyện lần 1 
- Kết quả của quá trình huấn luyện là bộ trọng số thu được lưu vào folder 
“trained_weights_final.h5”. 
3.2.2. Huấn luyện nhận diện phân biệt quả dứa xanh và chín (huấn luyện 
lần 2) 
Mục đích của việc huấn luyện này là giúp máy tính học cách phân biệt 
quả dứa xanh và quả dứa chín, sau khi đã phân biệt được quả dứa với các loại 
hoa quả khác. Để thực hiện bước này, nhóm 2 nhãn full baby pineapple (nhãn 
toàn bộ quả dứa non, cả thân và vương miện dứa) và full green pineapple (nhãn 
toàn bộ quả dứa xanh) thành 1 nhãn full green pineapple (nhãn toàn bộ dứa 
xanh); nhãn full ripe pineapple (nhãn toàn thân quả dứa chín) thành nhãn full 
ripe pineapple (nhãn toàn bộ dứa chín). 
- Bộ trọng số cơ sở: Sử dụng bộ trọng số thu được từ lần huấn luyện 1. 
- Bước 1: Đóng băng các lớp đầu và huấn luyện 2 lớp cuối qua 60 
epochs với learning rate là 1e-3 để đạt được trạng thái ổn định của loss. 
- Bước 2: Huấn luyện toàn mạng qua 60 epoch với learning rate ban 
đầu là 1e-4 (sử dụng thuật toán Reduce LROn Plateau để thay đổi learning 
rate trong quá trình huấn luyện). 
- Kết quả của quá trình huấn luyện là bộ trọng số thu được lưu vào 
folder “trained_weights_final_green_ripe.h5”. 
71 
3.2.3. Huấn luyện nhận diện phân biệt quả dứa xanh và chín dựa vào đặc 
điểm của thân trái và đ

File đính kèm:

  • pdfluan_an_nghien_cuu_he_thong_chuyen_dong_va_dieu_khien_tay_ma.pdf
  • pdfCV DeNghi (ncs.BuiLeCuongQuoc).pdf
  • pdfTomTatLuanAn (tiengAnh) _ncs.BuiLeCuongQuoc _DHLN.pdf
  • pdfTomTatLuanAn (tiengViet) _ncs.BuiLeCuongQuoc _DHLN.pdf
  • docxTrangThongTinDiemMoi _ncs.BuiLeCuongQuoc _DHLN.docx
  • docxTrichYeuLuanAn _ncs.BuiLeCuongQuoc _DHLN.docx