ファージディスプレイに基づくヒト腸内細菌叢の機能的メタゲノムスクリーニングによって同定された新しい炭水化物結合ドメイン

ブログ

ホームページホームページ / ブログ / ファージディスプレイに基づくヒト腸内細菌叢の機能的メタゲノムスクリーニングによって同定された新しい炭水化物結合ドメイン

Oct 31, 2023

ファージディスプレイに基づくヒト腸内細菌叢の機能的メタゲノムスクリーニングによって同定された新しい炭水化物結合ドメイン

Communications Biology volume 6、記事番号: 371 (2023) この記事を引用する 2698 アクセス数 1 引用数 10 Altmetric メトリクスの詳細 未培養の微生物は、巨大な未利用の生物資源を表します

Communications Biology volume 6、記事番号: 371 (2023) この記事を引用

2698 アクセス

1 引用

10 オルトメトリック

メトリクスの詳細

未培養の微生物は、新規遺伝子および遺伝子産物という未開発の巨大な生物資源を表します。 最近のゲノムおよびメタゲノム配列決定の取り組みにより、既存の注釈付き遺伝子と相同な多数の遺伝子が同定されていますが、既存の注釈付き遺伝子と有意な配列相同性が見つからない、注釈が付いていない遺伝子の膨大なプールがまだ残っています。 機能的メタゲノミクスは、新規遺伝子産物を特定し、注釈を付ける方法を提供します。 今回我々は、機能的メタゲノミクスを利用して、ヒトの腸内共生生物の付着、腸内定着、複雑な炭水化物の代謝を助ける可能性がある新規な炭水化物結合ドメインを発掘する。 我々は、健康なヒトの糞便サンプルからのメタゲノムファージディスプレイライブラリーの構築と、食物、微生物および宿主の多糖類/複合糖質に対する機能的スクリーニングについて報告する。 我々は、既知のタンパク質ドメインにはヒットしないが、炭水化物結合モジュール様の折り畳みを含むと予測されるいくつかのタンパク質配列を同定した。 我々は、これらのタンパク質ドメインの一部を異種発現、精製し、生化学的に特徴づけ、それらの炭水化物結合機能を実証します。 私たちの研究により、レバン結合ドメインと 4 つの複合 N-グリカン結合ドメインを含む、これまで注釈が付けられていなかったいくつかの糖結合ドメインが明らかになりました。これらのドメインは、これらのグリカンの標識、可視化、単離に役立つ可能性があります。

地球には、1 兆を超える種 2 からなる約 4 ~ 6 × 1030 細胞 1 の微生物群集が存在しますが、その大部分は標準的な実験室技術 3 では培養も研究もされていません。 微生物群集は、新しい酵素や生体分子を採掘するための潜在的な貯蔵庫となります4。 配列決定ベースおよび機能的メタゲノミクス(文化に依存しない手法の適用)は、新しい生体分子の発見のために微生物群集の複雑さを理解し、活用する強力な手段として機能してきました5。 機能的メタゲノミクスは、メタゲノム DNA ライブラリーの構築 (コスミド、フォスミド 6、ファージ 7 などの適切なベクターを使用) と、目的の表現型 8 のスクリーニングを含み、そのライブラリーに関する事前情報がなくても、目的の機能を持つ遺伝子産物をコードする遺伝子を同定することができます。公共データベースの配列類似性に基づくプロパティ。 したがって、この戦略は、バイオテクノロジー応用のための新規遺伝子/タンパク質を提供するとともに 8、データベース内で仮説タンパク質として指定されたタンパク質の機能割り当てにも役立ちます 9。

人間の腸は、宿主粘液13のムチンの内因性グリカン11、12やデンプン、ヘミセルロース、ペクチン10. ヒトゲノムは97個のグリコシド加水分解酵素のみをコードし、ショ糖、乳糖、デンプンなどの炭水化物栄養素に存在するグリコシド結合の小さなサブセットを破壊するのはわずか17個であるのとは対照的に、ヒト腸内細菌叢の177個の参照ゲノムで構築されたミニマイクロバイオームは、グリカン代謝に関与する 15,882 個の異なる炭水化物活性酵素 (CAZyme) 遺伝子を保有していることが判明しました 14。 腸内での複雑な炭水化物栄養素の代謝は、ヒトの腸内細菌叢を構成する約 160 種のおよそ 1 兆個の微生物の CAZyme によって行われていることは明らかです 15、16、17。 CAZyme は、多くの場合、1 つまたは複数の触媒ドメインと補助的な非触媒モジュールまたは炭水化物結合モジュール (CBM) 18 を連携させたモジュール構造を持っています。これらのモジュールは、触媒モジュールをアクセスできない基質の近くに持ち込んで、有効な基質濃度を増加させ、酵素効率19. CBM に加えて、細菌レクチンなどの他のタンパク質も腸内の炭水化物分子に結合します20。 したがって、ヒトの腸内微生物メタゲノムは、血液型検査 22、生体特異的アフィニティー精製 23、抗腫瘍および抗ウイルス療法のターゲティング用途 24 など、さまざまな用途 21 に活用できる炭水化物結合タンパク質をコードする遺伝子の巨大な宝庫です。また、宿主と共生相互作用についての理解も深まるかもしれません。

144 bp, indicating enrichment. A high degree of selection was also evident from the high frequency of occurrence of PCR amplicons of the same size among randomly picked phage clones for a given selection condition and sometimes, even for phage clones from different elution conditions (e.g. Fig. 2a–f). We confirmed this by sequencing a few amplicons of the same size and verifying that they had the same sequence. Sequences of all recombinant phage clones identified are listed in Supplementary Data 1, Table S4./p>90% sequence identity amongst Ap-Ap2, Ap-Ap5 and St-Glc2, and amongst Am-Glc2, St-Glc1, and St-Glc5, with the clone Am-Glc2 (197 amino acids long, amylose binder eluted with glucose) mapping almost completely within St-Glc1 (370 amino acids long, starch binder eluted with glucose) (Supplementary Data 1, Tables S4 and S9)./p>50% of their molecular mass12 and a rich oligosaccharide repertoire of ~100 different O-glycan structures that are differentially present along the length of the gut, thereby creating unique niches and potential binding sites along the gut for the colonization of bacteria11,53, perhaps contributing to the varying microbiota composition in different regions of the gut54,55. The ability to bind to or utilize mucin provides a competitive edge in colonization of the gut56,57,58,59, and gut symbionts like Akkermansia muciniphila60, Bifidobacterium61, Bacteroides species58, and Lactobacillus fermentum62 indulge in mucosal glycan foraging, secreting glycoside hydrolases (GHs) for mucin glycan degradation59,63./p>

Based on our biochemical evidence of glycan binding (and the high sequence similarity between MU1 and MU3), we suggest that MG1, MN3 and MU1/MU3 domains be annotated as new CBMs in the CAZy database. Future studies can focus on how these glycan binding domains compare with existing LacNAc binding galectins21,64 and Siaα2-6 binding proteins such as the human influenza A and B virus lectin haemagglutinin65, Pseudomonas aeruginosa pili66, the surface protein antigen (PAc) of Streptococcus mutans67, mushroom Polyporus squamosus agglutinin (PSA)68, and the plant lectins, Sambucus nigra agglutinin (SNA), Sambucus canadensis agglutinin (SCA), Sambucus sieboldiana agglutinin (SSA), Wheat-germ agglutinin (WGA), Trichosanthes japonica (TJA-I), and ML-I of Viscum album69,70,71,72,6 Gal beta 1->4GlcNAc and HSO3(-)- > 6Gal beta 1->GlcNAc specific lectin in tuberous roots of Trichosanthes japonica. Biochemistry 31, 11647–11650 (1992)." href="/articles/s42003-023-04718-0#ref-CR73" id="ref-link-section-d78971106e2617"73./p>144 bp (which is the size of the amplicon expected for a non-recombinant phage amplified by the T7UP and T7DOWN primers) were considered to be recombinant. Enriched recombinant phages were further subjected to Sanger sequencing in-house (at IMTECH, using 16-capillary 3130xl Genetic Analyzer, Applied Biosystems). DNA sequences obtained were translated using ExPASy80 and visualized using FinchTV version 1.4.0. Sequences with more than 30 continuous amino acids (without any stop codon) were considered for further analysis. These metagenomic sequences were subjected to searches against both the protein sequence database, ‘UniRef100’81, and the profile databases, ‘pfamA-full’ and ‘pfamB’31, and ‘dbCAN2’33 using mmseqs282 at a very high sensitivity (-s 8.5). In addition, an all-against-all sequence search of the initial 33 query proteins was also performed. The general command run for these searches was ‘mmseqs easy-search input_protein_seqs search_database output.result_file tmp_directory -s 8.5 --format-mode 2‘. In the search against UniRef100, for each query protein sequence, the top five returned hits were retained and were then further searched for pfamA-full domains as above using mmseqs2. The fields ‘representativeMember_organismName‘ and ‘cluster_representative_name‘ (in Table S5) were obtained using uniprot API81. In the search result against pfamA-full, the field ‘pfam-family_description‘ (in Table S7) was obtained using https://github.com/AlbertoBoldrini/python-pfam (a python interface for pfamA). Three-dimensional structure predictions were performed for all amino acid sequences using a local server installed AlphaFold2, and structures were visualized using reverse rainbow coloring based on pLDDT scores in PyMOL (Schrodinger) (Supplementary Data 2)./p>6 Gal beta 1->4GlcNAc and HSO3(-)- > 6Gal beta 1->GlcNAc specific lectin in tuberous roots of Trichosanthes japonica. Biochemistry 31, 11647–11650 (1992)./p>