Luận án Sàng lọc và biểu hiện gen mã hóa Protein ức chế Protease của vi sinh vật liên kết hải miên Spheciospongia Vesparium thu nhận tại vùng biển miền Trung, Việt Nam

Luận án Sàng lọc và biểu hiện gen mã hóa Protein ức chế Protease của vi sinh vật liên kết hải miên Spheciospongia Vesparium thu nhận tại vùng biển miền Trung, Việt Nam trang 1

Trang 1

Luận án Sàng lọc và biểu hiện gen mã hóa Protein ức chế Protease của vi sinh vật liên kết hải miên Spheciospongia Vesparium thu nhận tại vùng biển miền Trung, Việt Nam trang 2

Trang 2

Luận án Sàng lọc và biểu hiện gen mã hóa Protein ức chế Protease của vi sinh vật liên kết hải miên Spheciospongia Vesparium thu nhận tại vùng biển miền Trung, Việt Nam trang 3

Trang 3

Luận án Sàng lọc và biểu hiện gen mã hóa Protein ức chế Protease của vi sinh vật liên kết hải miên Spheciospongia Vesparium thu nhận tại vùng biển miền Trung, Việt Nam trang 4

Trang 4

Luận án Sàng lọc và biểu hiện gen mã hóa Protein ức chế Protease của vi sinh vật liên kết hải miên Spheciospongia Vesparium thu nhận tại vùng biển miền Trung, Việt Nam trang 5

Trang 5

Luận án Sàng lọc và biểu hiện gen mã hóa Protein ức chế Protease của vi sinh vật liên kết hải miên Spheciospongia Vesparium thu nhận tại vùng biển miền Trung, Việt Nam trang 6

Trang 6

Luận án Sàng lọc và biểu hiện gen mã hóa Protein ức chế Protease của vi sinh vật liên kết hải miên Spheciospongia Vesparium thu nhận tại vùng biển miền Trung, Việt Nam trang 7

Trang 7

Luận án Sàng lọc và biểu hiện gen mã hóa Protein ức chế Protease của vi sinh vật liên kết hải miên Spheciospongia Vesparium thu nhận tại vùng biển miền Trung, Việt Nam trang 8

Trang 8

Luận án Sàng lọc và biểu hiện gen mã hóa Protein ức chế Protease của vi sinh vật liên kết hải miên Spheciospongia Vesparium thu nhận tại vùng biển miền Trung, Việt Nam trang 9

Trang 9

Luận án Sàng lọc và biểu hiện gen mã hóa Protein ức chế Protease của vi sinh vật liên kết hải miên Spheciospongia Vesparium thu nhận tại vùng biển miền Trung, Việt Nam trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 187 trang nguyenduy 24/06/2025 80
Bạn đang xem 10 trang mẫu của tài liệu "Luận án Sàng lọc và biểu hiện gen mã hóa Protein ức chế Protease của vi sinh vật liên kết hải miên Spheciospongia Vesparium thu nhận tại vùng biển miền Trung, Việt Nam", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

Tóm tắt nội dung tài liệu: Luận án Sàng lọc và biểu hiện gen mã hóa Protein ức chế Protease của vi sinh vật liên kết hải miên Spheciospongia Vesparium thu nhận tại vùng biển miền Trung, Việt Nam

Luận án Sàng lọc và biểu hiện gen mã hóa Protein ức chế Protease của vi sinh vật liên kết hải miên Spheciospongia Vesparium thu nhận tại vùng biển miền Trung, Việt Nam
 của kết hải miên Spheciospongia 
vesparium QT2; Giếng M: DNA marker 1 kb GeneRulerTM 
 Sản phẩm PCR vùng siêu biến V4 gen 16S rRNA sau khi gắn mã vạch đã 
được giải trình tự, phân tích và so sánh với cơ sở dữ liệu Silva để xác định tính đa 
dạng của vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 ở các mức độ 
phân loại khác nhau. Với mẫu hải miên này, có 58,29 % reads (45.965 reads/ 78.849 
reads) đạt yêu cầu sử dụng cho phân loại, trong đó 82,93 % thuộc giới (domain) vi 
khuẩn, 16,84% thuộc cổ khuẩn (Archaea) và 0,23 % không nhận dạng được (Bảng 
3.5; Hình 3.10) 
65 
Bảng 3.5. Phân loại các reads 16S rRNA của hải miên Spheciospongia vesparium 
QT2 theo giới và ngành 
Giới Số 
reads 
% tổng số 
reads 
Tên ngành 
(Phylum) 
Số 
reads 
% tổng số 
reads 
Vi khuẩn 
(Bacteria) 
38119 82,93 Thaumarchaeota 7742 16,84 
Cổ khuẩn 
(Archaea) 
7741 16,84 Acidobacteria 1905 4,14 
Không xác 
định 
(Unclassified) 
106 0,23 Actinobacteria 3225 7,02 
 Bacteroidetes 882 1,92 
 Chloroflexi 3747 8,15 
 Deferribacteres 61 0,13 
 Gemmatimonadetes 3417 7,43 
 Nitrospirae 839 1,82 
 Proteobacteria 23658 51,47 
 Spirochaetes 383 0,83 
 Unclassified 106 0,23 
Đối với cổ khuẩn, chỉ nhận dạng được ngành Thaumarchaeota với tỉ lệ 16,84 
% tổng số reads, là một trong những ngành chiếm ưu thế. Ngành Proteobacteria 
chiếm tới hơn nửa số reads nhận được, gần 51,5 %. Các ngành chiếm ưu thế khác 
trong cộng đồng vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 lần 
lượt là Chloroflexi (8,15 % reads), Gemmatimonadetes (7,43 % reads), 
Actinobacteria (7,06 % reads), Acidobacteria (4,14 % reads) và Nitrospirae (1,82 % 
reads). Các ngành còn lại mỗi ngành chỉ chiếm dưới 1 % tổng số reads. 
66 
Hình 3.10. Phân loại vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 
 theo giới (bên trái) và ngành (bên phải) 
Các reads tiếp tục được phân loại đến mức thấp hơn là lớp và bộ. Bảng 3.6 
và Phụ lục 7 cho thấy 21 lớp vi khuẩn và 36 bộ đã được nhận dạng, trong đó 3 lớp 
chiếm đa số (Gammaproteobacteria 22,63 % reads), Marine_Group_I (15,55 % 
reads) và Betaproteobacteria (14,59 % reads). Có 0,23 % reads không được nhận 
dạng. 
Bảng 3.6. Phân loại các reads 16S rRNA vi sinh vật liên kết hải miên 
Spheciospongia vesparium QT2 đến lớp và bộ 
Lớp % tổng số 
reads 
Bộ % tổng số 
reads 
Gammaproteobacteria 22,63 Oceanospirillales 15,30 
Marine_Group_I 15,55 Nitrosomonadales 14,59 
Betaproteobacteria 14,59 Nitrosopumilus 12,94 
Deltaproteobacteria 8,41 Unclassified 7,88 
Gemmatimonadetes 7,43 Acidimicrobiales 7,01 
Acidimicrobiia 7,01 BD2-11_terrestrial_group 5,17 
Alphaproteobacteria 4,56 Sh765B-TzT-29 4,87 
Caldilineae 4,33 Caldilineales 4,33 
Acidobacteria 3,56 BPC015 3,10 
67 
TK10 2,06 Alteromonadales 3,07 
Cytophagia 1,92 Rhodospirillales 2,99 
Nitrospira 
1,82 PAUC43f_marine_benthic 
_group 
2,26 
Anaerolineae 1,34 Nitrospirales 1,82 
Soil_Crenarchaeotic_ 
Group(SCG) 
1,29 
Order_II_Incertae_Sedis 
1,70 
JTB23 1,06 Anaerolineales 1,34 
Spirochaetes 0,83 Pseudomonadales 1,27 
Holophagae 0,58 Desulfurellales 1,23 
SAR202_clade 0,27 GR-WP33-30 1,17 
Unclassified 0,23 HOC36 1,04 
SC3-20 0,21 Spirochaetales 0,83 
JG30-KF-CM66 0,14 Desulfobacterales 0,83 
Deferribacteres 0,13 Rhodobacterales 0,79 
 Chromatiales 0,62 
 TK85 0,58 
 E01-9C-26_marine_group 0,56 
 Xanthomonadales 0,37 
 Rickettsiales 0,34 
 Bdellovibrionales 0,30 
 32-21 0,27 
 Aeromonadales 0,26 
 Cytophagales 0,22 
 Acidobacteriales 0,18 
 Rhizobiales 0,17 
 MNG3 0,14 
 Deferribacterales 0,13 
 KI89A_clade 0,12 
 Kordiimonadales 0,12 
68 
Các bộ có tỉ lệ reads lớn hơn 10 % gồm Oceanospirillales (15,3 % reads), 
Nitrosomonadales (14,59 % reads) và Nitrosopumilus (12,94 % reads). Đối với 
phân loại mức bộ, có tới 7,88 % reads không được nhận dạng. Ở mức phân loại họ 
và chi, số lượng reads không được nhận dạng tăng lên rất nhiều, 58,53 % cho phân 
loại mức họ và tới 72,07 % cho phân loại đến chi. 
Bảng 3.7: Phân loại reads 16S rRNA vi sinh vật liên kết hải miên 
Spheciospongia vesparium QT2 đến họ; chi 
Họ % tổng số 
reads 
Chi % tổng số reads 
Unclassified 58,53 Unclassified 72,07 
Hahellaceae 14,33 Endozoicomonas 13,94 
Sva0996_marine_group 6,47 Caldilinea 4,33 
Caldilineaceae 4,33 Shewanella 3,07 
Shewanellaceae 3,07 Nitrospira 1,82 
Nitrospiraceae 1,82 Defluviicoccus 1,61 
Rhodothermaceae 1,70 Pseudomonas 0,92 
Rhodospirillaceae 1,61 Spirochaeta 0,38 
Desulfurellaceae 1,23 Acinetobacter 0,35 
Anaerolineaceae 1,12 Bdellovibrio 0,30 
Pseudomonadaceae 0,92 Aeromonas 0,26 
Nitrospinaceae 0,83 Granulosicoccus 0,23 
OCS155_marine_group 0,55 Persicobacter 0,22 
Rhodobacteraceae 0,38 Pseudovibrio 0,14 
Spirochaetaceae 0,38 Ruegeria 0,13 
Sinobacteraceae 0,38 Rhodovulum 0,11 
Moraxellaceae 0,35 Pseudospirillum 0,11 
TK34 0,34 
Bdellovibrionaceae 0,29 
Aeromonadaceae 0,26 
Granulosicoccaceae 0,22 
Flammeovirgaceae 0,22 
69 
Acidobacteriaceae 0,18 
PAUC34f 0,13 
Kordiimonadaceae 0,12 
Oceanospirillaceae 0,11 
SAR86_clade 0,10 
Trong số 22 họ nhận dạng, chỉ có họ Hahellaceae chiếm tỉ lệ 14,33 % tổng số 
reads, các họ khác chiếm tỉ lệ reads trên 1 % gồm Sva0996_marine_group, một họ 
candidate (6,47 % reads), Caldilineaceae (4,33 % reads), Shewanellaceae (3,07 % 
reads), Nitrospiraceae (1,82 % reads), Rhodothermaceae (1,7 % reads), 
Rhodospirillaceae (1,61 %), Desulfurellaceae (1,23 %) và Anaerolineaceae (1,12 
%). Tổng cộng có 16 chi vi khuẩn liên kết hải miên Spheciospongia vesparium QT2 
được nhận dạng, trong đó chi Endozoicomonas chiếm đa số (14,94 % reads), chi 
Caldilinea chiếm 4,33 %, chi Shewanella 3,07 %, Nitrospira chiếm 1,82 % reads và 
Defluviicoccus chiếm 1,61 % reads. Các chi còn lại mỗi chi chỉ chiếm không tới 1 
% tổng số reads (Bảng 3.7; Hình 3.11). 
Hình 3.11. Phân loại vi sinh vật liên kết hải miên Spheciospongia 
vespariumQT2 biển Quảng Trị theo chi 
Đã nhận dạng 10 ngành, 21 lớp, 36 bộ, 22 họ và 16 chi vi khuẩn liên kết với hải 
miên Spheciospongia vesparium QT2 biển Quảng Trị. 
70 
Sự đa dạng vi sinh vật liên kết hải miên biển được các nhà khoa học quan 
tâm nghiên cứu từ lâu do tầm quan trọng của chúng trong sinh thái hải miên cũng 
như khả năng sản sinh các chất có hoạt tính sinh học. Theo Li et al. (2006), vi 
khuẩn liên kết hải miên từ cùng một vị trí địa lý có sự đa dạng vi khuẩn trội khác 
nhau, chứng tỏ vi khuẩn liên kết hải miên là đặc hiệu vật chủ. Ví dụ, Proteobacteria 
cấu trúc α, β và γ chiếm đa số trong hải miên, và vi khuẩn có mối quan hệ phát sinh 
loài gần cũng được tìm thấy trong các loại hải miên khác nhau (Li et al., 2006). Kết 
quả nhận được đối với cộng đồng vi sinh vật liên kết hải miên Spheciospongia 
vesparium QT2 cho thấy, các ngành chủ yếu cũng được tìm thấy trong các loài hải 
miên khác (Proteobacteria, Gemmatimonadetes, Acidobacteria, Actinobacteria, 
Chloroflexi). Riêng ngành Thaumarchaeota phát hiện khá nhiều trong loài hải miên 
này, chiếm tới 16,84 % tổng số reads. Các chi trong hải miên Spheciospongia 
vesparium QT2 cũng chủ yếu là từ α và γ proteobacteria (Defluviicoccus và 
Shewanella, tương ứng), kết quả này trùng với kết quả của Li et al (2006); Hardoim 
&Costa (2014). Ngoài ra, Gemmatimonadetes và Nitrospira cũng được tìm thấy ở 
Spheciospongia vesparium QT2 và một số loài hải miên Ircinia (Hardoim & Costa., 
2014). 
Kết quả nghiên cứu bằng phương pháp 16S metagenomics cho thấy có 15 
ngành vi sinh vật (có độ phong phú lớn hơn 0,1 %) đã được tìm thấy liên kết với các 
mẫu hải miên Việt Nam (Phụ lục 7). Trong khi các nghiên cứu dựa vào phương 
pháp phân lập truyền thống chỉ phân lập được một lượng số lượng hạn chế các vi 
sinh vật liên kết với hải miên, phương pháp nghiên cứu đa dạng vi sinh vật không 
qua nuôi cấy như 16S metagenomics cho phép phát hiện được nhiều vi sinh vật mới 
và chưa được phân lập trước đây. Các nghiên cứu dựa vào phân lập thường chỉ phân 
lập được một số các vi khuẩn thuộc một vài ngành phổ biến như Proteobacteria (α 
và γ - Proteobacteria), Bacteroidetes, Cyanobacteria, Firmicutes. Trong đó các Chi 
như Bacillus, Streptomyces, Pseudovibrio, Vibrio, . thường được phân lập lặp đi 
lặp lại từ nhiều mẫu môi trường khác nhau (đất, hải miên, trầm tích, ). Vì vậy 
những vi khuẩn này thường được biết đến như những vi khuẩn cỏ dại “weedy 
bacteria” bởi chúng có thể phát triển nhanh trên các môi trường phân lập. Tuy 
nhiên, bằng phương pháp 16S metagenomics chúng tôi đã phát hiện được nhiều 
71 
ngành hiếm được phân lập hoặc chưa được phân lập thông qua phương pháp nuôi 
cấy như Thaumarchaeota, Acidobacteria, Chloroflexi, Deferribacteres, 
Deinococcus-Thermus, Planctomycetes, Delta-proteobacteria, Epsilon-
proteobacteria, Beta-proteobacteria, Spirochaetes, Verrucomicrobia (Phụ lục 8). 
3.3.5. Khai thác gen có hoạt tính ức chế protease (PIs) dựa trên cơ sở dữ liệu 
(CSDL) metagenomics 
 Bằng các công cụ tin sinh học, đã khai thác được 50 gen hoàn chỉnh liên 
quan đến chất ức chế protease từ CSDL là metagenomics QT2 (Quảng Trị) (Bảng 
3.8). Trong đó có 28 gen, chiếm 56 % được chú giải thuộc họ Serpin (Serine 
protease inhibitor); còn lại 22 gen (44 %) thuộc nhóm Inter-alpha-trypsin inhibitor. 
Gen ngắn nhất là 198 bp, mã hóa cho 66 axit amin; gen dài nhất là 2406 bp, mã hóa 
cho 802 axit amin. Một số gen cũng đã được xác định là gen mới ở Việt Nam (Bảng 
3.9). Nhằm xác định lại độ tin cậy của kết quả chú giải trên, một số trình tự axít 
amin đã được lựa chọn để so sánh protein trên NCBI. Kết quả sau so sánh cho thấy 
các axít amin này thuộc nhóm ức chế protease tương ứng với kết quả chú giải (Phụ 
lục 9). 
Bảng 3.8. Kết quả sàng lọc các gen có hoạt tính protease inhibitor từ CSDL 
metagenomics QT2 
TT 
Contig Locus_tag 
Acid 
amin 
Uni_ 
accession_1 
UniProtKB_ 
product 
Uni_ 
score 
Uni_ 
Evalue 
1 contig000016 Prokka_05808 442 Q5RB37 ITIH chain H3 89.4 1.00E-17 
2 contig000019 Prokka_06418 323 O02668 ITIH chain H2 61.2 5.00E-09 
3 contig000019 Prokka_06445 398 Q61703 ITIH chain H2 71.6 4.00E-12 
4 contig000046 Prokka_10704 429 Q9D154 Serpin 184 6.00E-52 
5 contig000046 Prokka_10705 405 Q5BIR5 Serpin 214 1.00E-63 
6 contig000127 Prokka_20087 328 Q3T052 ITIH chain H4 62 3.00E-09 
7 contig000172 Prokka_24210 400 Q8BJD1 ITIH chain H5 71.6 4.00E-12 
8 contig000213 Prokka_27784 418 Q5BIR5 Serpin B8 216 5.00E-64 
72 
9 contig000213 Prokka_27785 405 Q99574 Neuroserpin 209 2.00E-61 
10 contig000314 Prokka_34813 736 A6X935 ITIH 171 6.00E-43 
11 contig000433 Prokka_41698 419 Q5BIR5 Serpin B8 231 6.00E-70 
12 contig000631 Prokka_52340 325 Q3T052 ITIH chain H4 58.9 3.00E-08 
13 contig000726 Prokka_56621 398 Q61703 ITIH chain H2 57 2.00E-07 
14 contig000981 Prokka_67673 428 Q90935 Neuroserpin 214 1.00E-62 
15 contig001114 Prokka_72799 419 Q5BIR5 Serpin B8 219 4.00E-65 
16 contig001390 Prokka_82416 386 A6X935 ITIH 114 4.00E-26 
17 contig001690 Prokka_91580 454 Q5BIR5 Serpin B8 152 5.00E-40 
18 contig001737 Prokka_93032 412 Q5BIR5 Serpin B8 214 1.00E-63 
19 contig001737 Prokka_93033 223 Q99574 Neuroserpin 87.8 6.00E-19 
20 contig001813 Prokka_95168 412 Q99574 Neuroserpin 207 3.00E-60 
21 contig002069 Prokka_102253 280 Q8PTN8 serpin 175 7.00E-50 
22 contig002236 Prokka_106102 324 A2VE29 ITIH chain H5 64.7 4.00E-10 
23 contig002339 Prokka_108516 478 Q14624 ITIH chain H4 63.5 2.00E-09 
24 contig002592 Prokka_114432 355 Q90935 Neuroserpin 197 3.00E-57 
25 contig002838 Prokka_119867 334 Q14624 ITIH chain H4 55.5 3.00E-07 
26 contig003102 Prokka_125566 401 Q8BJD1 ITIH chain H5 58.5 5.00E-08 
27 contig003892 Prokka_140659 323 Q3T052 ITIH chain H4 67 7.00E-11 
28 contig004584 Prokka_152589 631 Q61703 ITIH chain H2 66.2 6.00E-10 
29 contig005997 Prokka_173538 430 Q8PTN8 Serpin 206 2.00E-59 
30 contig006820 Prokka_184178 417 Q5BIR5 Serpin B8 237 5.00E-72 
31 contig007047 Prokka_186946 497 Q61703 ITIH chain H2 122 2.00E-28 
32 contig007181 Prokka_188591 146 Q96P15 Serpin B11 105 5.00E-26 
73 
33 contig007964 Prokka_197295 66 Q90935 Neuroserpin 51.6 7.00E-08 
34 contig008443 Prokka_202257 443 P50453 Serpin B9 213 2.00E-62 
35 contig010618 Prokka_222724 382 Q8BJD1 ITIH chain H5 64.3 8.00E-10 
36 contig012483 Prokka_237228 378 Q9JK88 Serpin I2 57 1.00E-07 
37 contig015758 Prokka_258680 430 Q9S7T8 Serpin-ZX 143 1.00E-36 
38 contig020504 Prokka_283125 394 Q90935 Neuroserpin 73.2 8.00E-13 
39 contig020772 Prokka_284248 402 Q90935 Neuroserpin 213 1.00E-62 
40 contig020806 Prokka_284376 802 Q61703 ITIH chain H2 142 2.00E-33 
41 contig020909 Prokka_284844 362 A6X935 ITIH 104 6.00E-23 
42 contig021896 Prokka_288956 722 P56652 ITIH chain H3 170 8.00E-43 
43 contig024785 Prokka_300295 303 Q29052 ITIH chain H1 55.5 3.00E-07 
44 contig030105 Prokka_318139 717 Q9GLY5 ITIH chain H3 116 2.00E-25 
45 contig033816 Prokka_328453 391 B4USX2 Serpin B10 220 1.00E-65 
46 contig038363 Prokka_339464 376 Q9CQV3 Serpin B11 82 7.00E-16 
47 contig040171 Prokka_346561 423 Q99574 Neuroserpin 211 1.00E-61 
48 contig044964 Prokka_352966 457 Q5JJ64 Serpin 249 7.00E-76 
49 contig060339 Prokka_377096 149 Q9UIV8 Serpin B13 66.6 4.00E-12 
50 contig067320 Prokka_385523 98 Q5NBM0 Putative serpin 66.2 1.00E-12 
Chú thích: ITIH: Inter-alpha-trypsin inhibitor heavy; Serpin: serine protease inhibitor; I: Inhibitor 
Bảng 3.9. Ví dụ về gen mới được sàng lọc 
STT Tên gen 
Chiều 
dài Nu 
Độ tương 
đồng (%) 
Đặc điểm 
1 
Predicted_gene_
346561 
1398 55.98 
Neuroserpin; AltName: 
Full=Peptidase inhibitor 12; 
Short=PI-12; AltName: 
Full=Serpin I1; Flags: 
Precursor 
2 Predicted_gene_ 1893 49.75 Inter-alpha-trypsin inhibitor 
74 
91473 heavy chain H2; Short=ITI 
heavy chain H2; Short=ITI-
HC2; Short=Inter-alpha-
inhibitor heavy chain 2 
Việc phát hiện các con đường sinh tổng hợp quan tâm trong hệ cộng sinh 
phức tạp như hải miên là thách thức cực lớn bởi sự đa dạng cao của hệ vi sinh vật 
liên kết. Vì vậy, chiến lược khai thác (mining) metagenome được áp dụng để phát 
hiện các hợp chất chưa biết từ vi sinh vật không nuôi cấy được và có thể khám phá 
các hợp chất được vi sinh vật liên kết sản sinh (Barone et al., 2014). 
Các chiến lược metagenomics được sử dụng thành công để phân lập và xác 
định các enzyme có hoạt tính sinh học mới, hoặc các chất chuyển hóa thứ cấp từ các 
thành phần không thể phục hồi của các cộng đồng vi sinh vật từ các mẫu môi trường 
khác nhau. Các enzyme thích nghi lạnh có thể hoạt động mạnh hơn tới 10 lần ở 
nhiệt độ thấp và trung bình (Singh., 2010; Selvin et al., 2012; Baroneet al., 2014; 
Alma’abadi et al., 2015,). Một nghiên cứu trước đây đã xây dựng một thư viện 
plasmid chứa khoảng 50.000 bản sao từ DNA metagenomics phân lập ở các mẫu 
nước biển (Jiang et al., 2010). Các mẫu nước biển được thu thập từ Biển Đông. 
DNA plasmid từ các dòng vô tính được chọn ngẫu nhiên và được cắt bằng enzyme 
giới hạn EcoRІ. Các DNA có kích thước khoảng 1-15 kb, trung bình khoảng 4,0 kb. 
Kết quả này xác nhận rằng thư viện metagenomics biển có chứa các phân tử DNA 
từ bộ gen không bị biến đổi. Các metagenome biển của vi sinh vật xuất hiện tự 
nhiên cũng được chứng minh có chứa một nhóm gen rất lớn. Hầu hết các gen này 
không được tìm thấy bằng phương pháp phân lập truyền thống. Từ thư viện này, 
Jiang et al. (2011) đã khai thác 1 gen mới, được gọi là Spi1C. Gen này có khung 
đọc mở dài 642 bp, với hàm lượng G + C là 49,92 %, mã hóa 214 axít amin. Trọng 
lượng phân tử tương đối được dự đoán (Mr) là khoảng 24 kDa và điểm đẳng điện là 
4,33. Những giá trị này phù hợp với trọng lượng phân tử khoảng 20-40 kDa quan 
sát được của đa số các protein serpin (Torres-Castillo et al., 2009). Chỉ số không ổn 
định của Spi1C đã được xác định là 24,90, như vậy, Spi1C được coi là một Serpin 
tương đối ổn định. Trình tự axít amin của Spi1C đã được so sánh (BLAST) trên cơ 
sở dữ liệu NCBI (National Center for Biotechnology Information) và ExPaSy 
(Expert Protein Analysis System). Kết quả cho thấy protein Spi1C tương đồng 57-
75 
60 % với các chất ức chế protease Serpin I4. Trong nghiên cứu này, chúng tôi cũng 
đã sàng lọc được trên 50 % gen (28 gen) liên quan đến chất ức chế serpin, và kết 
quả so sánh trên NCBI, ExPaSy cho thấy các gen này tương đồng trên 50 % với các 
chất ức chế serpin khác (Phụ lục 9). Theo hiểu biết của chúng tôi thì đây là công 
trình thứ hai công bố về khai thác gen ức chế protease từ cơ sở dữ liệu 
metagenomics từ môi trường biển. Chất ức chế serpin là một siêu họ quan trọng và 
lớn nhất của chất ức chế protease. Chúng hoạt động như một điều biến (modulator) 
và tham gia vào rất nhiều quá trình phân giải protein quan trọng, liên kết hóa trị với 
protein đích và bất hoạt chúng (Jiang et al., 2011). Do đó kết quả nghiên cứu của 
chúng tôi mở ra một tiềm năng triển vọng về khai thác các gen này để nghiên cứu 
và ứng dụng trong các ngành y dược. 
3.4. Nghiên cứu biểu hiện gen ức chế protease (PIs) trong hệ Escherichia coli 
Dựa vào kết quả khai thác gen PIs từ CSDL metagenomics QT2, đã thiết kế 
một số cặp mồi để tách dòng các gen ức chế protease thuộc họ serpin mong muốn 
với template là DNA metagenome mẫu QT2 bằng phương pháp PCR. Tuy nhiên, 
mặc dù đã thay đổi rất nhiều thông số trong chu trình PCR nhưng vẫn không tách 
dòng được theo phương pháp PCR thông thường. Vì vậy, dựa vào kết quả sàng lọc 
gen (Bảng 3.8), trình tự gen contig 000046, contig000433 và contig020504 đã được 
tổng hợp (GenScript) và đưa vào vector tách dòng pUC57. Các gen lựa chọn ngoài 
là gen được chú giải thuộc họ serpin (ức chế serine protease) còn có một số ưu điểm 
hơn các contig khác như: gen mới, trình tự gen hoàn chỉnh (có độ tương đồng dưới 
85 % với các gen liên quan đến chất ức chế protease đã được công bố trên ngân 
hàng gen NCBI), trọng lượng protein dự đoán khoảng 30-55 kDa (thuận tiện cho 
quá trình biểu hiện, tinh sạch và thu hồi protein tái tổ hợp), ngoài ra, các contig này 
đều có giá trị Uni-evalue cao và tin cậy. Các contig 000046, contig000433 và 
contig020504 được đặt tên là PI-QT, PI-QT1 và PI-QT2, tương ứng. 
Trong quá trình nghiên cứu, đã thiết kế thành công các vectơ biểu hiện pET-
32a(+) trong hệ E. coli và vectơ pPIC9 biểu hiện trong P. pastoris mang 3 gen PI-
QT, PI-QT1 và PI-QT2. Tuy nhiên, các gen PI-QT1 và PI-QT2 biểu hiện protein tái 
tổ hợp nằm trong cặn tế bào ở dạng không tan trong hệ E.coli BL21 (DE3) và không 
biểu hiện được trong hệ P. pastoris SDM1168 dưới các điều kiện nghiên cứu. Chỉ 
76 
có gen PI-QT biểu hiện trong cả hệ E. coli và P. pastoris thu được protein tái tổ hợp 
ở trạng thái tan. Vì vậy, trong luận án này chỉ báo cáo về quá trình biểu hiện gen PI-
QT trong 2 hệ biểu hiện nghiên cứu. 
3.4.1. Phân tích trình tự a xít amin và cây phân loại của protein PI-QT 
Gen PI-QT có kích thước 1287 bp, mã hóa cho 429 axít amin, trọng lượng 
protein dự đoán khoảng 50 kDa, điểm đẳng điện theo lý thuyết là 4.56. So sánh 
trình tự axít amin của PI-QT với các trình tự trong cơ sở dữ liệu NCBI cho thấy 
protein PI-QT tương đồng với các serpin khoảng 50 – 55 % và peptide PI-QT có 
các vùng bảo thủ giống với các trình tự của protein này trong vi sinh vật (Hình 
3.12). 
Hình 3.12: So sánh trình tự axít amin của protein PI-QT với các trình tự 
tương đồng trên cơ sở dữ liệu NCBI 
77 
Các chuỗi peptide được xử lý bằng phần mềm ClustalW. Các serpin đã biết 
(từ CSDL NCBI) bao gồm: RKU17271, RKU16626, RKU24896, RKU24895, 
RKU11755 (chất ức chế protease Serpin I4 từ vi khuẩn); RKZ34327 (protein vi 
khuẩn họ serpin); WP_068816727 (chất ức chế protease Serpin I4 từ vi khuẩn 
Phormidesmis priestleyi), WP_058997120 (chất ức chế protease Serpin I4 từ vi 
khuẩn Leptolyngbya sp. NIES-2104), WP_106255732 (chất ức chế protease Serpin 
I4 từ vi khuẩn Leptolyngbya frigida), WP_048868337 (chất ức chế protease Serpin 
I4 từ vi khuẩn Scytonema tolypothrichoides), RCJ36945 (chất ức chế protease 
Serpin I4 từ vi khuẩn Nostoc mi

File đính kèm:

  • pdfluan_an_sang_loc_va_bieu_hien_gen_ma_hoa_protein_uc_che_prot.pdf
  • pdfĐóng góp mới.pdf
  • pdfTóm tắt TA.pdf
  • pdfTóm tắt TV.pdf
  • pdfTrích yếu luận án.pdf