Luận án Nghiên cứu giải pháp kỹ thuật xây dựng cơ sở dữ liệu quản lý tài nguyên khoáng sản bằng công nghệ WEBGIS
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
Bạn đang xem 10 trang mẫu của tài liệu "Luận án Nghiên cứu giải pháp kỹ thuật xây dựng cơ sở dữ liệu quản lý tài nguyên khoáng sản bằng công nghệ WEBGIS", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.
Tóm tắt nội dung tài liệu: Luận án Nghiên cứu giải pháp kỹ thuật xây dựng cơ sở dữ liệu quản lý tài nguyên khoáng sản bằng công nghệ WEBGIS
đã phát triển trong vài năm mà Grant Boxer giảng dạy QGIS cho các nhà khoa học địa lý ở Tây Úc. Grant Boxer đã sử dụng QGIS từ năm 2015 sau khoảng 20 năm sử dụng phần mềm MapInfo-Discover. Ông đã tham gia thăm dò và khai thác địa chất hơn 40 năm, với gần 20 năm làm việc ở CRA Exploration Pty Limited, Argyle Diamonds và Rio Tinto Exploration; 20 năm qua đã tham gia vào vai trò tư vấn cho ngành công nghiệp khai thác, thăm dò kim cương với các hoạt động ở Úc, Brazil, Trung Quốc, 53 Greenland, Ấn Độ, và thăm dò các khoáng sản khác nhau bao gồm kim loại cơ bản, quặng sắt và mangan. Ông nhận thấy QGIS là một công cụ có giá trị cho ngành thăm dò khoáng sản và là một giải pháp thay thế khả thi cho phần mềm GIS thương mại trên thị trường. Mặc dù không được viết riêng cho các ứng dụng địa chất, QGIS có thể thực hiện hầu hết các nhiệm vụ GIS cần thiết mà các nhà khoa học địa chất ngày nay yêu cầu. Trong luận án này, dựa vào nhiều kết quả nghiên cứu khác, tác giả sẽ lựa chọn QGIS để biên tập, xây dựng CSDL không gian tài nguyên khoáng sản. 2.2. Một số kỹ thuật xử lý dữ liệu dựa trên mô hình WebGIS mở 2.2.1. WMS WMS là một giao thức chuẩn được phát triển bởi OGC vào năm 1999 nhằm cung các các ảnh bản đồ tham chiếu địa lý trên internet. WMS là một giao thức được hỗ trợ bởi nhiều ứng dụng bản đồ bao gồm Gaia của The Carbon Project, Google Earth, uDig và OpenLayers. Hình 2.6. Mô hình tổng quan dịch vụ WMS Hình 2.7 là lược đồ về mô hình mày khách - máy chủ sử dụng dịch vụ WMS. Trình biểu diễn phía máy khách gồm một loạt các trang HTML chạy bên trong trình duyệt web có thể tương tác với máy chủ WMS bởi ứng dụng khách thông qua các lời gọi HTTP. Ứng dụng máy khách WMS quản lý sự tương tác với các giao diện WMS thông qua các yêu cầu HTTPS và tự động tạo HTML để có thể chạy trong trình duyệt Web. Máy chủ WMS chấp nhận các yêu cầu từ máy khách WMS và trình biểu diễn khách dưới dạng các chuỗi HTTP URL, trả về kết quả được mã hóa dạng XML, GIF, GMLCSDL lưu trữ dữ liệu đối tượng địa lý sẽ được truy cập và sử dụng bởi máy chủ WMS nhằm tạo ra các tài liệu GML hoặc các bản đồ dạng hình ảnh [55] [56]. 54 Hình 2.7. Lược đồ về mô hình máy khách - máy chủ sử dụng WMS WMS cung cấp dữ liệu hình ảnh raster ở nhiều cấp độ phân giải, định dạng khác nhau, được sử dụng trong nhiều ứng dụng GIS. WMS cung cấp các hoạt động sau: - GetCapabilities: lấy thông tin về các lớp bản đồ được hỗ trợ, bao gồm các lớp hình ảnh và lớp siêu dữ liệu khác nhau. - GetMap: truy xuất hình ảnh bản đồ của các lớp dữ liệu. - GetFeatureInfo: lấy siêu dữ liệu (thông tin) về các đối tượng được hiển thị trong hình ảnh bản đồ. - GetLegendGpson: lấy thông tin về kiểu dáng hiển thị của các lớp bản đồ, đặc biệt là các lớp siêu dữ liệu. Các tham số của WMS cho phép người dùng lựa chọn bản đồ với kích thước và độ phân giải khác nhau và có thể biểu diễn ở bất kỳ tỷ lệ nào. Để xác định được tỷ lệ bản đồ đang sử dụng, máy chủ sẽ thực hiện tính toán DPP cho hình ảnh được yêu cầu và tìm mức độ zoom của tile gần nhất, theo các công thức như sau: 𝐷𝑃𝑃 = ೣ ା ଶ (2.1) 55 𝐷𝐷𝑃௫ = 𝜆ଵ − 𝜆 𝑊 (2.2) 𝐷𝐷𝑃௬ = 𝜃ଵ − 𝜆 𝐻 (2.3) 𝜆ଵ : kinh độ lớn nhất của khung nhìn bản đồ 𝜆 : kinh độ nhỏ nhất của khung nhìn bản đồ 𝜃ଵ : vĩ độ lớn nhất của khung nhìn bản đồ 𝜃 : vĩ độ nhỏ nhất của khung nhìn bản đồ W: chiều rộng của khung nhìn bản đồ theo điểm ảnh H: chiều cao của khung nhìn bản đồ theo điểm ảnh Việc tính toán số lượng tile cần thiết cho quá trình tạo ảnh bản đồ, dựa theo công thức: 𝐷𝑃𝑃 = 360.0 2 𝑝 (2.4) Trong đó: p - số lượng điểm ảnh trên tile, i - mức độ zoom 2.2.2. WFS WFS là chuẩn giao tiếp địa lý của OGC, được phát hành năm 2005. WFS mô tả các hoạt động thao tác trên các đối tượng địa lý dạng hình học như điểm, đường, vùng thông qua gian thức HTTP. Chuẩn WFS được viết bằng XML và sử dụng GML để biểu diễn các thông tin đối tượng địa lý. WFS hỗ trợ các hoạt động thêm, cập nhập, xóa, truy vấn các đối tượng địa lý [30]. Hình 2.8 là lược đồ về mô hình máy khách - máy chủ sử dụng dịch vụ WFS. Trình biểu diễn phía máy khách gồm một chuỗi các trang HTML chạy bên trong trình duyệt Web có thể tương tác với máy chủ WFS bởi ứng dụng máy khách thông qua các lời gọi HTTPS. Máy khách WFS quản lý các tương tác với giao diện WFS thông qua các yêu cầu HTTPS và tự động tạo HTML có thể chạy trong trình duyệt Web. 56 Hình 2.8. Lược đồ về mô hình máy khách - máy chủ sử dụng WFS Máy chủ WFS chấp nhận các yêu cầu từ máy khách WFS dưới dạng các chuỗi HTTPS và trả về các kết quả được mã hóa dạng XML, GIF, GML CSDL lưu trữ dữ liệu đối tượng địa lý mà có thể được truy cập và sử dụng bởi máy chủ WFS nhằm tạo ra các tài liệu GML hay bản đồ. WFS hỗ trợ các hoạt động như sau: - GetCapabilities: xác định các FeatureType được hỗ trợ. - DescribeFeatureType: tìm các thuộc tính có sẵn đối với các FeatureType - GetFeature: lấy các thuộc tính của FeatureType. Trong luận án này, tác giả sẽ sử dụng chuẩn WFS để biểu diễn, thao tác các đối tượng hình học có trong CSDL không gian tài nguyên khoáng sản. 2.2.3. TMS TMS là một đặc tả kỹ thuật cho các bản đồ Web dạng tile, được phát triển bởi OSGeo năm 2006. Giao thức TMS lấp đầy khoảng cách giữa chuẩn đơn giản được sử dụng bởi OpenStreetMap và sự phức tạp của chuẩn WMS. TMS được sử dụng rộng rãi nhất bởi máy chủ và máy khách dạng bản đồ Web, trong khi giao thức WMS được sử dụng rộng rãi hơn trong các ứng dụng bản đồ doanh nghiệp. Một số 57 các hãng lớn trên thế giới cung cấp các dịch vụ TMS như Google, OpenStreetMap, Micrsoft [42]. TMS sẽ quy ước việc chuẩn hóa kích thước của các tile, số lượng cấp độ zoom, phép chiếu bản đồ, cách đánh số cho các tile. Chẳng hạn như OpenStreetMap sẽ thiết lập tên tile là XYZ.png với X, Y là số thứ tự của tile tính theo các chiều kinh độ, vĩ độ còn Z là cấp độ zoom. Hầu hết các hãng sử dụng TMS sẽ tuân theo các quy ước của Google Map với: - Tile có kích thước 256 x 256 điểm ảnh. - Ở cấp độ zoom = 0, thế giới được hiển thị là một tile - Với mỗi mức zoom tăng lên thì mỗi tile sẽ được chia thành 4 tile chi tiết hơn. Khoảng cách ngang biểu diễn bởi mỗi tile vuông, được đo dọc theo vĩ tuyến tại vĩ độ nhất đinh và được tính theo công thức: 𝑆௧ = 𝐶 × cos(𝑙𝑎𝑡𝑖𝑡𝑢𝑑𝑒) 2௭௩ (2.5) Trong đó, C là chu vi theo đường xích đạo của trái đất (40075016.686 m ≈ 2π x 6378 137.000 m đối với phép tham chiếu Geoid được sử dụng bởi OpenStreetMap). Vì các tile có kích thước là 256 điểm ảnh, như vậy khoảng cách ngang được biểu diễn bởi một điểm ảnh là 𝑆௫ = 𝑆௧ 256 = 𝐶 × cos(𝑙𝑎𝑡𝑖𝑡𝑢𝑑𝑒) 2(௭௩ା ) (2.6) Số lượng hàng, cột được xác định tương ứng với mỗi mức zoom bởi công thức: 𝐶 = 2 (2.7) 𝑅 = 2ିଵ (2.8) Mối quan hệ giữa địa chỉ các tile, tọa độ địa lý và mức độ zoom được xác định bởi các công thức: 𝜆 = 𝑐 360.0 2 − 180.0 (2.9) 𝜆௫ = (𝑐 + 1) 360.0 2 − 180.0 (2.10) 𝜃 = 𝑟 360.0 2ିଵ − 90.0 (2.11) 58 𝜃௫ = (𝑟 + 1) 360.0 2ିଵ − 90.0 (2.12) Trong đó: c - chỉ số cột; r - chỉ số hàng; 𝜆 - kinh độ; 𝜃 - vĩ độ; i - mức độ zoom 2.2.4. WMTS WMTS là một giao thức chuẩn được phát triển bởi OGC nhằm cung cấp các tile bản đồ được tính toán trước thời gian chạy hoặc được tính toán qua Internet. WMTS được phát hành lần đầu năm 2010. Chuẩn WMTS cung cấp các bản đồ số bằng cách sử dụng các mảnh ảnh được xác định trước. Chuẩn WMTS bổ sung cho chuẩn WMS hiện có của OGC. WMTS xác định một tập hợp các chức năng nhằm trả về các đối tượng địa lý có thể được sử dụng trong bất kỳ loại phân tích không gian địa lý nào [25]. Hình 2.10 là mô hình tổng quan dịch vụ WMTS. Hình 2.9. Mô hình tổng quan dịch vụ WMTS Khi sử dụng dịch vụ WMTS, ứng dụng máy khách sẽ yêu cầu các thông tin từ WMTS. Máy chủ WMTS lấy thông tin phù hợp từ CSDL bao gồm các đối tượng, tile, FeatureInfo và các thông tin liên quan. Mục đích của việc cung cấp các dịch vụ hỗ trợ WMTS là cung cấp hiệu suất cao trong khi thay đổi cấp độ zoom. Do đó, máy chủ trả về các tile nhanh chóng. Một trong những cách tốt nhất đề thực hiện điều này là tạo trước các tile được lưu trữ cục bộ. Mục đích của WMTS là cung cấp các bản đồ đã được chia thành các tile nhỏ. 59 Hình 2.10. Dịch vụ WMTS chia hình ảnh thành các tile. Dịch vụ WMTS cung cấp dữ liệu ảnh (định dạng PNG hoặc JPEG) với các độ phân giải khác nhau, được xác định trươc. Điều này làm cho WMTS có hiệu suất xử lý cao hơn so với chuẩn WMS [60]. Hình 2.11 là lược đồ mô hình máy khách - máy chủ sử dụng dịch vụ WMTS. Trình biểu diễn máy khách là một chuỗi các trang HTML chạy bên trong trình duyệt Web có thể tương tác với máy chủ WMTS thông qua ứng dụng máy khách. Máy chủ WMTS chấp nhận các yêu cầu từ máy khách WMTS và dưới dạng chuỗi URL HTTP và trả về kết quả được mã hóa dưới dạng XML, PNG, GML... WMTS tương tự như WMS, nhưng nó cho phép hiệu suất máy chủ tốt hơn trong các ứng dụng liên quan đến một số yêu cầu xử lý đồng thời. WMTS được tối ưu hóa để trả về nhanh các ảnh tile từ bộ đệm tới người dùng hay các ứng dụng. 60 Hình 2.11. Lược đồ về mô hình máy khách - máy chủ sử dụng dịch vụ WMTS So với WMS, WTMS có ưu điểm hơn ở khía cạnh môi lần người dùng dịch chuyển vùng hiển thị thì hầu hết các tile có liên quan vẫn được hiển thị, trong khi các tile mới sẽ được tìm, nạp thêm vào. Điều này cải thiện nhiều tốc độ hiển thị bản đồ so với cách tìm nạp bản đồ duy nhất cho toàn bộ vùng hiển thị. Nó cho phép tính toán trước khi hiển thị các tile bằng cách sử dụng kỹ thuật song song. Hiển thị hình ảnh được cung cấp từ máy chủ sẽ yêu cầu ít tính toán hơn so với hiển thị hình ảnh trong trình duyệt, đây là ưu điểm so với công nghệ WFS. Hình 2.12. Biểu diễn thuật toán lựa chọn tile để hiển thị [60]. 61 Hiện nay, các chuẩn bản đồ dạng tile như WMTS được sử dụng nhiều trong các ứng dụng bản đồ Web. Năm 2012, nhóm nghiên cứu [50] đã tiến hành nghiên cứu chiến lược lưu vào bộ nhớ đệm để cải thiện hiệu suất của các ứng dụng địa lý dựa trên Web. Một trong những thách thức mà nhóm nghiên cứu gặp phải là độ trễ khi tải các mảnh bản đồ WMS. Phải mất vài phút để tải tất cả các mảnh bản đồ khi ứng dụng được khởi động lần đầu. Ngoài ra, mỗi khi người dùng cố gắng thao tác trên bản đồ như xoay, thu phóng, họ phải chịu thêm độ trễ do tốc độ tải chậm. Điều này dẫn đến rất nhiều sự thất vọng của người dùng và trở thành ưu tiên hàng đầu cần phải giải quyết. Hình 2.13. Mô hình sử dụng kỹ thuật Map Tile trong bộ nhớ đệm Để giải quyết độ trễ, nhóm nghiên cứu đã giới thiệu một máy chủ bộ nhớ cache, dùng để lưu trữ các ảnh bản đồ dạng tile trong một máy chủ proxy. Như minh họa trong Hình 2.13, máy chủ proxy lưu vào bộ nhớ cache các tile ảnh ở các tỷ lệ khác nhau. Điều này làm giảm số lượng yêu cầu tải dữ liệu trực tiếp từ máy chủ bản đồ WMS. Để đánh giá những cải thiện về hiệu suất, nhóm nghiên cứu đã đo thời gian phản hồi trung bình trên các trình duyệt khác nhau (Firefox, Safari, Chrome). Bảng 62 2.4 cho thấy thời gian phản hồi trước và sau khi giới thiệu máy chủ bộ đệm sử dụng các ảnh bản đồ dạng tile. Bằng cách giới thiệu máy chủ bộ nhớ cache, nhóm nghiên cứu đã giảm được thời gian phản hồi dữ liệu ảnh bản đồ. Trong luận án này, tác giả sẽ sử dụng chuẩn WMTS để biểu diễn nhanh các lớp dữ liệu bản đồ nền nhằm hỗ trợ hiển thị thông tin cho CSDL tài nguyên khoáng sản. Bảng 2.4. So sánh tốc độ xử lý giữa WMS và tile map Thời gian phản hồi sử dụng chuẩn WMS Thời gian phản hồi sử dụng dịch mảnh bản đồ dạng tile 0.8~2.5s/yêu cầu bản đồ 0.02~0.25s/yêu cầu bản đồ 2.2.5. Kỹ thuật lập chỉ mục không gian GiST trong PostGIS PostGIS bao gồm các chức năng phân tích GIS và lập chỉ mục không gian. Các chỉ mục cực kỳ quan trọng đối với các bảng không gian lớn, vì chúng cho phép truy xuất nhanh các bản ghi trong quá trình truy vấn. PostGIS thường được sử dụng trong quá trình phân tích các tập dữ liệu lớn nêu việc thiết lập các chỉ mục không gian là cần thiết [69], [54]. Hình 2.14. Cách chỉ mục không gian làm việc Hình 2.14 thể hiện cách chỉ mục không gian làm việc trong CSDL. Số lượng các đường giao cắt với ngôi sao là 1, đó là đường màu đỏ, nhưng các hộp đặc trưng giao với hộp màu vàng là 2, gồm hộp màu đỏ và màu xanh dương. Cách mà CSDL trả lời hiệu quả câu hỏi “đường nào giao cắt với ngôi sao màu vàng”, trước tiên sẽ trả lời câu hỏi “những hộp nào giao với hộp màu vàng” bằng cách sử dụng chỉ mục và sau đó thực hiện tính toán một cách chính xác đường nào sẽ giao với ngôi sao màu vàng. Chỉ mục giúp việc sử dụng CSDL không gian lớn trở lên dễ dàng hơn 63 [43]. Nếu không có việc đánh chỉ mục, thì bất kỳ việc tìm kiếm sẽ yêu cầu “quét tuần tự” tất cả các bản ghi có trong CSDL. Chỉ mục không gian GiST (Cây tìm kiếm tổng quát - Generalized Search Tree) được mô tả ban đầu bởi Hellerstein. Nó là một cấu trúc cung cấp phương pháp truy cập dạng cây cân bằng và có thể dễ dàng mở rộng đối với các kiểu dữ liệu được lập chỉ mục. Ngoài việc cung cấp khả năng mở rộng cho các loại dữ liệu, GiST còn hợp nhất các cấu trúc khác nhau thành cấu trúc được sử dụng cho các loại dữ liệu phổ biến hiện nay. GiST thực hiện các cơ chế lập chỉ mục như cây B+ và cây R, nhằm tạo một mã duy nhất để lập chỉ mục cho nhiều ứng dụng khác nhau [68] [71]. Hình 2.15. Cây tìm kiếm CSDL không gian sử dụng chỉ số GiST Chỉ mục GiST có hai ưu điểm so với các chỉ mục R-Tree: - Các chỉ mục GiST là an toàn null (“null safe”), có nghĩa là chúng có thể lập chỉ mục các cột bao gồm các giá trị null. Các chỉ mục R-Tree ban đầu trong PostgreSQL không hỗ trợ điều này. Vì vậy, sử dụng R-tree sẽ không thể xây dựng một chỉ mục trên dạng hình học chứa giá trị null. - Chỉ mục GiST hỗ trợ khái niệm “lossiness”. Điều này rất quan trọng khi xử lý các đối tượng GIS kích thước có kích thước lớn hơn 8 Kb. Lossiness cho phép PostgreSQL chỉ lưu trữ các phần quan trọng của một đối tượng trong một chỉ mục. Các đối tượng GIS lớn hơn 8Kb sẽ khiến các chỉ mục R-Tree bị lỗi. Để tạo chỉ mục không gian GiST trong postGIS, câu lệnh SQL chuẩn có dạng tổng quát: Create index on using gist (); Để xóa chỉ mục, sử dụng câu lệnh: Drop index ; 64 2.3. Một số thuật toán chiết tách thông tin khoáng sản trên ảnh viễn thám 2.3.1. Chỉ số khoáng sản Tỷ số kênh (band ratio) giữa hai kênh ảnh K và L được định nghĩa như sau: Bij = B୧୨ B୧୨ (2.13) BijK - giá trị độ sáng điểm ảnh (i, j) kênh K; BijL - giá trị điểm ảnh (i, j) kênh L. Như vậy, việc chia giá trị độ sáng tương ứng từng điểm ảnh của hai kênh sẽ nhận được giá trị độ sáng của điểm ảnh mới. Ảnh mới thu nhận được gọi là ảnh tỷ số. Ảnh tỷ số thường được sử dụng để loại trừ ảnh hưởng của bóng râm, ảnh hưởng của địa hình, và tách biệt một số đặc tính các yếu tố địa chất, nhằm làm nổi bật các đối tượng cần quan tâm như vùng phủ thực vật, hay các khoáng sản lộ thiên. Việc lựa chọn hai kênh ảnh trong tập dữ liệu ảnh viễn thám để tạo ảnh tỷ số cần phải có cơ sở khoa học, những nghiên cứu cụ thể và dưạ trên đồ thị phản xạ phổ [73]. Chỉ số khoáng sản là phép tính toán trên các kênh ảnh nhằm làm nổi bật đặc trưng phản xạ của các lớp khoáng sản dựa trên kỹ thuật tỷ số kênh ảnh. Dưới đây là một số loại chỉ số khoáng sản hay được sử dụng trong viễn thám. Chỉ số khoáng sản sét (Clay Minerals Ratio - CMR) Các khoáng chất sét đặc trưng cho sự thay đổi thủy nhiệt trong các loại đá và chúng bị hấp thụ mạnh trong trong phạm vi phổ khoảng 2.2 𝜇𝑚, ngược lại có sự phản xạ mạnh trong phạm vi phổ 1.6 𝜇𝑚. Vì vậy phổ phản xạ của các khoáng chất đất sét có thể được tăng cường bằng cách thực hiện tỷ số hai kênh hồng ngoại sóng ngắn (Shortwave Infrared – SWIR) [46]. 𝐶𝑀𝑅 = 𝑆𝑊𝐼𝑅1 − min (𝑆𝑊𝐼𝑅1) 𝑆𝑊𝐼𝑅2 − min(𝑆𝑊𝐼𝑅2) + 1 (2.14) Trong đó, SWIR1: 1.55-1.75 µm; SWIR2: 2.08-2.35 µm. Đối với ảnh Landsat-8: 𝐶𝑀𝑅 = 𝐵𝑎𝑛𝑑6 − min (𝐵𝑎𝑛𝑑6) 𝐵𝑎𝑛𝑑7 − min(𝐵𝑎𝑛𝑑7) + 1 (2.15) Hình 2.16 là kết quả của phép chia kênh 6 cho kênh 7 trên tập dữ liệu ảnh vệ tinh Landsat-8. Khu vực có giá trị điểm ảnh sáng hơn thể hiện mỏ sét Hữu Khánh, 65 xã Tân Phương, huyện Thanh Thủy, tỉnh Phú Thọ Hình 2.16. Khu vực mỏ sét Hữu Khánh, Tân Phương, Thanh Thủy, Phú Thọ. Chỉ số oxit sắt (Iron oxide ratio index - IORI) Oxit sắt là một trong những khoáng chất thường có trong môi trường tự nhiên. Chúng xuất hiện như màu đỏ hoặc đỏ nâu. Các đặc tính màu đỏ trên bề mặt đất, như là đất đỏ thường liên kết chặt chẽ với sự có mặt của các khoáng chất chứa sắt. Việc sử dụng tỷ số giữa các kênh ảnh đỏ và xanh lam sẽ làm tăng cường phổ phản xạ của các oxit sắt [46]: 𝐼𝑂𝑅𝐼 = 𝑆𝑊𝐼𝑅 𝑁𝐼𝑅 (2.16) Trong đó, SWIR: 1.55-1.75 µm; NIR: 0.76-0.9 µm. Đối với ảnh Landsat-8: 𝐼𝑂𝑅𝐼 = 𝐵𝑎𝑛𝑑6 𝐵𝑎𝑛𝑑5 (2.17) Hình 2.17 là kết quả của phép chia kênh 6 cho kênh 5 trên tập dữ liệu ảnh vệ tinh Landsat-8. Khu vực có giá trị điểm ảnh sáng hơn thể hiện mỏ sắt Trại Cau, Đồng Hỷ, Thái Nguyên. 66 Hình 2.17. Khu vực mỏ sắt, Trại Cau, Đồng Hỷ, Thái Nguyên 2.3.2. Phương pháp PCA Phương pháp PCA là một phương pháp thống kê đa biến nổi tiếng và thường được sử dụng trong nghiên cứu mối liên hệ giữa các biến. Đây là một kỹ thuật chiết tách thông tin nâng cao và thường được sử dụng trong khoa học trái đất [46]. Thuật toán này lần đầu tiên được giới thiệu bởi Pearson (1901), và được phát triển một cách độc lập bởi Hotelling (1933). Bằng phép biến đổi trực giao, một số biến tương quan ban đầu có thể được biến đổi thành các biến không tương quan dựa ma trận hiệp phương sai. Các biến không tương quan này được gọi là thành phần chính (Principal Component - PC). Dữ liệu ảnh vệ tinh quang học là tập dữ liệu đa kênh phổ điển hình có độ tương quan lớn. Đối với ảnh vệ tinh đa phổ, PCA sẽ biến đổi tập dữ liệu ban đầu thành các ảnh PC. Sự biến đổi này sẽ nén dữ liệu ảnh bằng loại bỏ các thông tin trùng lặp (các yếu tố tương quan) và tập trung hầu hết các thông tin ở một vài PC đầu tiên [46]. PCA đã được sử dụng rộng rãi trong viễn thám để thành lập các bản đồ địa chất khoáng sản. 67 Hình 2.18. Mô tả phép biến đổi trực giao tuyến tính giữa hai kênh ảnh 1 và 2 Giả sử X biểu diễn một ảnh đa phổ m kênh: X = (Xଵ Xଶ X୫) X୧ (i = 1, mതതതതത) là kênh phổ thứ i. Mỗi kênh phổ có n điểm ảnh, được biểu diễn dưới dang: X୧ = (x୧ଵ x୧ଶ x୧୬). Như vậy, ma trận X có kích thước n x m, có dạng: X = ቌ xଵଵ xଵଶ xଶଵ xଶଶ x୫ଵ x୫ଶ xଵ୬ xଶ୬ x୫୬ ቍ ୬ ×୫ Trong đó, 𝑥 biểu diễn giá trị điểm ảnh thứ j của kênh ảnh i. Quá trình thực hiện PCA, cần phải tính toán một số các giá trị thống kê ảnh. Giá trị trung bình ảnh Mଡ଼ là vector biểu diễn giá trị trung bình của ảnh X, có dạng: Mଡ଼ = (μଵ μଶ μ୫) μ୧ = 1 n − 1 x୧୨ ୬ ୨ୀଵ (2.18) Trong đó, 𝜇 là giá trị trung bình của kênh ảnh thứ i. 68 Giá trị phương sai ảnh 𝑉𝑎𝑟 là vector biểu diễn giá trị trung bình của ảnh X, có dạng: 𝑉𝑎𝑟 = (𝑉𝑎𝑟ଵ 𝑉𝑎𝑟ଶ 𝑉𝑎𝑟)் 𝑉𝑎𝑟 = 𝜎ଶ = 1 𝑛 − 1 ൫𝑥 − 𝜇൯ ଶ ୀଵ (2.19) Ma trận hiệp phương sai ảnh Hiệp phương sai giữa hai kênh ảnh k và t, kí hiệu là 𝑐௧ được tính theo công thức: 𝑐௧ = 1 𝑛 − 1 ቌ൫𝑥 − 𝜇൯൫𝑥௧ − 𝜇௧൯ ୀଵ ቍ (2.20) Như vậy, hiệp phương sai của ảnh X sẽ là ma trận vuông, đối xứng cấp m 𝐶𝑜𝑣 = ൭ 𝑐ଵଵ 𝑐ଵ 𝑐ଵ 𝑐 ൱ Thông qua các phép biến đổi đại số tuyến tính, ma trận hiệp phương sai 𝐶𝑜𝑣 có thể được biến đổi thành ma trận đường chéo có n giá trị không âm trên đường chéo chính G = ቌ 𝜆ଵ 0 ⋱ 0 𝜆 ቍ 𝜆ଵ > 𝜆ଶ > ⋯ > 𝜆 > 0 𝑣ớ𝑖 𝑛 ≤ 𝑚 Giá trị 𝜆୧ là trị riêng thứ I, thể hiện lượng thông tin được tập trung ở 𝑃𝐶. Công thức tính lượng thông tin tập trung tại ảnh thành phần chính thứ i được xác định như sau: inf(𝑃𝐶) = 𝜆 ∑ 𝜆ୀଵ (2.21) Ma trận vector riêng 𝐺 là nghiệm
File đính kèm:
- luan_an_nghien_cuu_giai_phap_ky_thuat_xay_dung_co_so_du_lieu.pdf
- QĐ Hoi dong cap truong - Dau Thanh Binh.pdf
- Tóm Tắt Luận Án_Tiếng Anh.pdf
- Tóm Tắt Luận Án_Tiếng Việt.pdf