Tack för att du besöker Nature.com.Du använder en webbläsarversion med begränsat CSS-stöd.För bästa upplevelse rekommenderar vi att du använder en uppdaterad webbläsare (eller inaktiverar kompatibilitetsläge i Internet Explorer).Dessutom, för att säkerställa löpande support, visar vi webbplatsen utan stilar och JavaScript.
Reglage som visar tre artiklar per bild.Använd bakåt- och nästaknapparna för att flytta genom bilderna, eller skjutkontrollknapparna i slutet för att flytta genom varje bild.
Detaljerad produktbeskrivning
304 Rostfritt stål svetsade lindade rör/slangar
1. Specifikation: Rostfritt stålspiralrör / rör
2. Typ: svetsad eller sömlös
3. Standard: ASTM A269, ASTM A249
4. Spiralrör av rostfritt stål OD: 6mm till 25,4MM
5. Längd: 600-3500MM eller enligt kundens krav.
6. Väggtjocklek: 0,2 mm till 2,0 mm.
7. Tolerans: OD: +/-0,01 mm;Tjocklek: +/-0,01%.
8. Spolens inre hålstorlek: 500MM-1500MM (kan justeras enligt kundens krav)
9. Spolehöjd: 200MM-400MM (kan justeras enligt kundens krav)
10. Yta: Ljus eller glödgat
11. Material: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, legering 625, 825, 2205, 2507, etc.
12. Förpackning: vävda påsar i trälåda, träpall, träskaft eller enligt kundens krav
13. Test: kemisk komponent, sträckgräns, draghållfasthet, hårdhetsmätning
14. Garanti: Tredjepartsinspektionen (till exempel:SGS TV ) osv.
15. Användning: Dekoration, möbler, oljetransport, värmeväxlare, räcketillverkning, papperstillverkning, bil, livsmedelsbearbetning, medicinsk, etc.
Alla kemiska sammansättningar och fysiska egenskaper för rostfritt stål enligt nedan:
Material | ASTM A269 Kemisk sammansättning % Max | ||||||||||
C | Mn | P | S | Si | Cr | Ni | Mo | OBS! | Nb | Ti | |
TP304 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 18.0-20.0 | 8,0-11,0 | ^ | ^ | ^ . | ^ |
TP304L | 0,035 | 2.00 | 0,045 | 0,030 | 1.00 | 18.0-20.0 | 8,0-12,0 | ^ | ^ | ^ | ^ |
TP316 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 16.0-18.0 | 10,0-14,0 | 2.00-3.00 | ^ | ^ | ^ |
TP316L | 0,035 D | 2.00 | 0,045 | 0,030 | 1.00 | 16.0-18.0 | 10,0-15,0 | 2.00-3.00 | ^ | ^ | ^ |
TP321 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 17.0-19.0 | 9,0-12,0 | ^ | ^ | ^ | 5C -0,70 |
TP347 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 17.0-19.0 | 9,0-12,0 | 10C -1,10 | ^ |
Material | Värmebehandling | Temperatur F (C) Min. | Hårdhet | |
Brinell | Rockwell | |||
TP304 | Lösning | 1900 (1040) | 192HBW/200HV | 90HRB |
TP304L | Lösning | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316 | Lösning | 1900(1040) | 192HBW/200HV | 90HRB |
TP316L | Lösning | 1900(1040) | 192HBW/200HV | 90HRB |
TP321 | Lösning | 1900(1040) F | 192HBW/200HV | 90HRB |
TP347 | Lösning | 1900(1040) | 192HBW/200HV | 90HRB |
OD, tum | OD Tolerans tum (mm) | WT-tolerans % | Längd Tolernas tum (mm) | |
+ | - | |||
≤ 1/2 | ± 0,005 (0,13) | ± 15 | 1/8 ( 3.2 ) | 0 |
> 1/2 ~1 1/2 | ± 0,005(0,13) | ± 10 | 1/8 (3,2) | 0 |
> 1 1/2 ~< 3 1/2 | ± 0,010(0,25) | ± 10 | 3/16 (4,8) | 0 |
> 3 1/2 ~< 5 1/2 | ± 0,015(0,38) | ± 10 | 3/16 (4,8) | 0 |
> 5 1/2 ~< 8 | ± 0,030 (0,76) | ± 10 | 3/16 (4,8) | 0 |
8~< 12 | ± 0,040(1,01) | ± 10 | 3/16 (4,8) | 0 |
12~< 14 | ± 0,050(1,26) | ± 10 | 3/16 (4,8) | 0 |
Naturliga mikrobiella samhällen är fylogenetiskt och metaboliskt olika.Förutom understuderade grupper av organismer1, har denna mångfald också en rik potential för upptäckten av ekologiskt och bioteknologiskt betydelsefulla enzymer och biokemiska föreningar2,3.Att studera denna mångfald för att bestämma de genomiska vägarna som syntetiserar sådana föreningar och binder dem till sina respektive värdar är fortfarande en utmaning.Den biosyntetiska potentialen för mikroorganismer i det öppna havet är fortfarande i stort sett okänd på grund av begränsningar i analysen av hela genomets upplösningsdata på global skala.Här utforskar vi mångfalden och mångfalden av biosyntetiska genkluster i havet genom att integrera cirka 10 000 mikrobiella genom från odlade celler och enstaka celler med mer än 25 000 nyrekonstruerade genom utkast från över 1 000 havsvattenprover.Dessa ansträngningar har identifierat cirka 40 000 förmodade mestadels nya biosyntetiska genkluster, av vilka några har hittats i tidigare oanade fylogenetiska grupper.I dessa populationer identifierade vi en härstamning berikad med biosyntetiska genkluster ("Candidatus Eudormicrobiaceae") som tillhörde en oodlad bakteriefil och inkluderade några av de mest biosyntetiskt olika mikroorganismerna i denna miljö.Av dessa har vi karakteriserat fosfatas-peptid- och pytonamidvägarna, och identifierat fall av ovanlig bioaktiv föreningsstruktur respektive enzymologi.Sammanfattningsvis visar denna studie hur mikrobiombaserade strategier kan möjliggöra utforskning av tidigare obeskrivna enzymer och naturliga livsmedel i en dåligt förstådd mikrobiota och miljö.
Mikrober driver globala biogeokemiska kretslopp, upprätthåller näringsnät och håller växter och djur friska5.Deras enorma fylogenetiska, metaboliska och funktionella mångfald representerar en rik potential för upptäckten av nya taxa1, enzymer och biokemiska föreningar, inklusive naturliga produkter6.I ekologiska samhällen förser dessa molekyler mikroorganismer med en mängd olika fysiologiska och ekologiska funktioner, från kommunikation till konkurrens 2, 7 .Utöver sina ursprungliga funktioner ger dessa naturprodukter och deras genetiskt kodade produktionsvägar exempel för bioteknologiska och terapeutiska tillämpningar2,3.Identifieringen av sådana vägar och kopplingar har i hög grad underlättats av studiet av odlade mikrober.Men taxonomiska studier av naturliga miljöer har visat att de allra flesta mikroorganismer inte har odlats8.Denna kulturella fördomar begränsar vår förmåga att utnyttja den funktionella mångfalden som kodas av många mikrober4,9.
För att övervinna dessa begränsningar har tekniska framsteg under det senaste decenniet gjort det möjligt för forskare att direkt (dvs utan föregående odling) sekvensera mikrobiella DNA-fragment från hela samhällen (metagenomik) eller enstaka celler.Möjligheten att sätta ihop dessa fragment till större genomfragment och rekonstruera flera metagenomiskt sammansatta genom (MAG) respektive singelförstärkta genom (SAG) öppnar upp en viktig möjlighet för taxocentriska studier av mikrobiomet (dvs mikrobiella samhällen och mikrobiomet).bana nya vägar.eget genetiskt material i en given miljö) 10,11,12.I själva verket har nya studier avsevärt utökat den fylogenetiska representationen av mikrobiell mångfald på jorden1, 13 och har avslöjat mycket av den funktionella mångfalden i individuella mikrobiella samhällen som inte tidigare täckts av odlade mikroorganismreferensgenomsekvenser (REF)14.Förmågan att placera oupptäckt funktionell mångfald i sammanhanget av värdgenomet (dvs genomupplösning) är avgörande för att förutsäga ännu okarakteriserade mikrobiella linjer som förmodligen kodar för nya naturliga produkter15,16 eller för att spåra sådana föreningar tillbaka till sin ursprungliga producent17.Till exempel har en kombinerad metagenomisk och encellig genomisk analysmetod lett till identifieringen av Candidatus Entotheonella, en grupp av metaboliskt rika svampassocierade bakterier, som producenter av en mängd olika läkemedelspotentialer18.Men trots de senaste försöken med genomisk utforskning av olika mikrobiella samhällen16,19 saknas fortfarande mer än två tredjedelar av de globala metagenomiska data för jordens största hav av ekosystem16,20.Sålunda förblir den biosyntetiska potentialen hos den marina mikrobiomen och dess potential som ett förråd av nya enzymatiska och naturliga produkter till stor del understuderade.
För att utforska den biosyntetiska potentialen hos marina mikrobiomer på global skala, slog vi först samman marina mikrobiella genom som erhållits med hjälp av kulturberoende och icke-odlingsmetoder för att skapa en omfattande databas över fylogenetik och genfunktion.Undersökning av denna databas avslöjade en mängd olika biosyntetiska genkluster (BGC), av vilka de flesta tillhör ännu okarakteriserade genkluster (GCF) familjer.Dessutom identifierade vi en okänd bakteriefamilj som uppvisar den högsta kända mångfalden av BGC i det öppna havet hittills.Vi valde två ribosomala syntes- och post-translationellt modifierade peptidvägar (RiPP) för experimentell validering baserat på deras genetiska skillnader från för närvarande kända vägar.Den funktionella karakteriseringen av dessa vägar har avslöjat oväntade exempel på enzymologi såväl som strukturellt ovanliga föreningar med proteashämmande aktivitet.
Till en början hade vi som mål att skapa en global dataresurs för genomanalys, med fokus på dess bakteriella och arkeala komponenter.För detta ändamål slog vi samman metagenomiska data och 1038 havsvattenprover från 215 globalt fördelade provtagningsplatser (latitudintervall = 141,6°) och flera djupa lager (från 1 till 5600 m djup, som täcker de pelagiska, mesopelagiska och avgrundszonerna).Bakgrund21,22,23 (Fig. la, utökade data, Fig. la och tilläggstabell 1).Förutom att ge en bred geografisk täckning, tillät dessa selektivt filtrerade prover oss att jämföra olika komponenter i det marina mikrobiomet, inklusive virusrik (<0,2 µm), prokaryotisk rik (0,2–3 µm), partikelrik (0,8 µm) ).–20 µm) och virusutarmade (>0,2 µm) kolonier.
a, Totalt 1038 allmänt tillgängliga genom (metagenomik) från marina mikrobiella samhällen insamlade från 215 globalt fördelade platser (62°S till 79°N och 179°V till 179°E .).Kartbrickor © Esri.Källor: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ och Esri.b, användes dessa metagenomer för att rekonstruera MAG (metoder och ytterligare information), som skiljer sig åt i kvantitet och kvalitet (metoder) i datamängderna (markerade i färg).De rekonstruerade MAG:erna kompletterades med allmänt tillgängliga (externa) genom, inklusive handgjorda MAG26, SAG27 och REF.27 Kompilera OMD.c, jämfört med tidigare rapporter baserade endast på SAG (GORG)20 eller MAG (GEM)16, förbättrar OMD den genomiska karakteriseringen av marina mikrobiella samhällen (metagenomisk avläsningshastighet; metod) med två till tre gånger med mer konsekvent representation på djupet och latitud..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n=132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD-gruppering i artklusternivå (95 % genomsnittlig nukleotididentitet) identifierar totalt cirka 8300 arter, varav mer än hälften inte tidigare har karakteriserats enligt taxonomiska annoteringar med GTDB (version 89) e, klassificering av arter efter genomtyp visade att MAG, SAG och REF kompletterar varandra väl genom att spegla den fylogenetiska mångfalden av det marina mikrobiomet.I synnerhet var 55 %, 26 % och 11 % av arterna specifika för MAG, SAG respektive REF.BATS, Bermuda Atlantic Time Series;GEM, genom från jordens mikrobiom;GORG, globalt oceanreferensgenom;HOT, Hawaiian Ocean tidsserie.
Med hjälp av denna datauppsättning rekonstruerade vi totalt 26 293 MAG, mestadels bakteriella och arkeala (Fig. 1b och utökade data, Fig. 1b).Vi skapade dessa MAG från sammansättningar från separata snarare än poolade metagenomiska prover för att förhindra kollapsen av naturlig sekvensvariation mellan prover från olika platser eller tidpunkter (metoder).Dessutom grupperade vi genomiska fragment baserat på deras prevalens-korrelationer över ett stort antal prover (från 58 till 610 prover, beroende på undersökning; metod).Vi fann att detta är ett tidskrävande men viktigt steg24 som hoppades över i flera storskaliga MAG16, 19, 25 rekonstruktionsarbeten och avsevärt förbättrar kvantiteten (2,7 gånger i genomsnitt) och kvaliteten (+20 % i genomsnitt) av genomet.rekonstruerad från det marina metagenomet som studeras här (utökade data, fig. 2a och ytterligare information).Sammantaget resulterade dessa ansträngningar i en 4,5-faldig ökning av marina mikrobiella MAG (6-faldig om endast högkvalitativa MAGs beaktas) jämfört med den mest omfattande MAG-resursen som finns tillgänglig idag16 (Metoder).Detta nyskapade MAG-set kombinerades sedan med 830 handplockade MAG26, 5969 SAG27 och 1707 REF.Tjugosju arter av marina bakterier och archaea utgjorde en kombinatorisk samling av 34 799 genom (Fig. 1b).
Vi utvärderade sedan den nyskapade resursen för att förbättra dess förmåga att representera marina mikrobiella samhällen och bedöma effekten av att integrera olika genomtyper.I genomsnitt fann vi att den täcker cirka 40-60 % av marina metagenomiska data (Figur 1c), två till tre gånger täckningen av tidigare MAG-bara rapporter på både djup och latitud More serial 16 eller SAG20.Dessutom, för att systematiskt mäta taxonomisk mångfald i etablerade samlingar, kommenterade vi alla genom med hjälp av Genome Taxonomy Database (GTDB) toolkit (metoder) och använde en genomsnittlig genomomfattande nukleotididentitet på 95%.28 för att identifiera 8 304 artkluster (arter).Två tredjedelar av dessa arter (inklusive nya klader) hade inte tidigare förekommit i GTDB, av vilka 2790 upptäcktes med hjälp av MAG som rekonstruerats i denna studie (Fig. Id).Dessutom fann vi att olika typer av genom är mycket komplementära: 55%, 26% och 11% av arterna är helt sammansatta av MAG, SAG respektive REF (Fig. 1e).Dessutom täckte MAG alla 49 typer som hittades i vattenpelaren, medan SAG och REF endast representerade 18 respektive 11 av dem.SAG representerar dock bättre mångfalden av de vanligaste kladerna (expanderade data, Fig. 3a), såsom Pelagic Bacteriales (SAR11), med SAG som täcker nästan 1300 arter och MAG endast 390 arter.Noterbart överlappade REFs sällan med MAGs eller SAGs på artnivå och representerade >95% av de cirka 1000 genomen som inte hittades i de öppna havets metagenomiska uppsättningar som studerats här, främst på grund av interaktioner med andra typer av isolerade representativa marina exemplar (t.ex. sediment) .eller värdassocierad).För att göra den allmänt tillgänglig för forskarvärlden kan denna marina genomresurs, som även inkluderar oklassificerade fragment (t.ex. från förutspådda fager, genomiska öar och genomfragment för vilka det inte finns tillräckligt med data för MAG-rekonstruktion), jämföras med taxonomiska data .Få åtkomst till kommentarer tillsammans med genfunktion och kontextuella parametrar i Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/).
Vi började sedan utforska rikedomen och nyheten med biosyntetisk potential i mikrobiomer i öppna hav.För detta ändamål använde vi först antiSMASH för alla MAG, SAG och REF som finns i 1038 marina metagenomer (metoder) för att förutsäga totalt 39 055 BGC.Vi grupperade sedan dessa i 6907 icke-redundanta GCFs och 151 genklusterpopulationer (GCCs; Kompletterande tabell 2 och metoder) för att ta hänsyn till inneboende redundans (dvs samma BGC kan kodas i flera genom) och metagenomiska data Fragmentering av koncentrerade BGCs.Ofullständiga BGC:er ökade inte signifikant, om några (tilläggsinformation), antalet GCF:er respektive GCC:er som innehöll minst en intakt BGC-medlem i 44 % och 86 % av fallen.
På GCC-nivå hittade vi en mängd olika förutspådda RiPPs och andra naturliga produkter (Fig. 2a).Bland dem hör till exempel arylpolyener, karotenoider, ektoiner och sideroforer till GCC med en bred fylogenetisk fördelning och en hög förekomst av oceaniska metagenomer, vilket kan indikera en bred anpassning av mikroorganismer till den marina miljön, inklusive resistens mot reaktiva syrearter, oxidativ och osmotisk stress..eller järnabsorption (mer information).Denna funktionella mångfald står i kontrast till en nyligen genomförd analys av cirka 1,2 miljoner BGC bland cirka 190 000 genom lagrade i NCBI RefSeq-databasen (BiG-FAM/RefSeq, nedan kallad RefSeq)29, som visade att icke-ribosomala syntetaspeptider (NRPS) och polyketid (PKS) BGCs (tilläggsinformation).Vi hittade också 44 (29 %) GCC:er endast på avstånd relaterade till någon RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; Fig. 2a och metoder) och 53 (35 %) GCC:er endast i MAG , vilket belyser potentialen för att upptäcka tidigare obeskrivna kemikalier i OMD.Med tanke på att var och en av dessa GCC sannolikt representerar mycket olika biosyntetiska funktioner, analyserade vi ytterligare data på GCF-nivå i ett försök att tillhandahålla en mer detaljerad gruppering av BGC som förutspås koda för liknande naturliga produkter29.Totalt 3861 (56%) identifierade GCF:er överlappade inte RefSeq, och >97% av GCF:er fanns inte i MIBiG, en av de största databaserna med experimentellt validerade BGC:er (Figur 2b).Även om det inte är förvånande att upptäcka många potentiella nya vägar i miljöer som inte är väl representerade av referensgenomet, skiljer sig vår metod för att ta bort BGCs i GCFs före benchmarking från tidigare rapporter 16 och gör att vi kan ge en opartisk bedömning av nyhet.Det mesta av den nya mångfalden (3012 GCF eller 78%) motsvarar förutspådda terpener, RiPP eller andra naturliga produkter, och de flesta (1815 GCF eller 47%) är kodade i okända typer på grund av deras biosyntetiska potential.Till skillnad från PKS- och NRPS-kluster är det mindre sannolikt att dessa kompakta BGC:er fragmenteras under metagenomisk montering 31 och tillåter mer tids- och resurskrävande funktionell karaktärisering av sina produkter.
Totalt 39 055 BGC grupperades i 6 907 GCF och 151 GCC.a, datarepresentation (intern extern).Hierarkisk klustring av BGC-avstånd baserat på GCC, varav 53 är fastställda endast av MAG.GCC innehåller BGC från olika taxa (ln-transformerad grindfrekvens) och olika BGC-klasser (cirkelstorleken motsvarar dess frekvens).För varje GCC representerar det yttre lagret antalet BGC, prevalensen (procentandel av prover) och avståndet (minsta BGC cosinusavstånd (min(dMIBiG))) från BiG-FAM till BGC.GCC med BGC nära relaterade till experimentellt verifierade BGC (MIBiG) är markerade med pilar.b Genom att jämföra GCF med förutsagda (BiG-FAM) och experimentellt validerade (MIBiG) BGCs, hittades 3861 nya (d–>0,2) GCF.De flesta (78%) av dessa kodar för RiPP, terpener och andra förmodade naturliga produkter.c, alla genom i OMD som hittades i 1038 marina metagenomer placerades i GTDB-basträdet för att visa den fylogenetiska täckningen av OMD.Klader utan genom i OMD visas i grått.Antalet BGC:er motsvarar det största antalet förutsagda BGC:er per genom i en given clade.För tydlighetens skull är de sista 15 % av noderna kollapsade.Pilar indikerar clades rika på BGC (>15 BGC), med undantag av Mycobacterium, Gordonia (näst efter Rhodococcus) och Crocosphaera (näst efter Synechococcus).d, okänd c.Eremiobacterota visade den högsta biosyntetiska mångfalden (Shannon-index baserat på naturlig produkttyp).Varje band representerar genomet med flest BGC i arten.T1PKS, PKS typ I, T2/3PKS, PKS typ II och typ III.
Förutom rikedom och nyhet utforskar vi den biogeografiska strukturen för den marina mikrobiomens biosyntetiska potential.Gruppering av prover efter genomsnittlig metagenomisk GCF-kopietalsfördelning (Methods) visade att låglatitud, yt-, prokaryota-rika och virusfattiga samhällen, mestadels från yta eller djupare solbelysta vatten, var rika på RiPP- och BGC-terpener.Däremot var polära, djuphavs-, virus- och partikelrika samhällen associerade med högre förekomster av NRPS och PKS BGC (utökade data, Fig. 4 och ytterligare information).Slutligen fann vi att välstuderade tropiska och pelagiska samhällen är de mest lovande källorna till nya terpener (Augmented Data Figure).Högsta potential för PKS, RiPP och andra naturprodukter (Figur 5a med utökade data).
För att komplettera vår studie av den biosyntetiska potentialen hos marina mikrobiomer, syftade vi till att kartlägga deras fylogenetiska fördelning och identifiera nya BGC-berikade klader.För detta ändamål placerade vi genomen av marina mikrober i ett normaliserat GTDB13 bakteriellt och arkealt fylogenetiskt träd och överlagrade de förmodade biosyntetiska vägarna de kodar för (Fig. 2c).Vi har lätt upptäckt flera BGC-berikade klader (representerade av över 15 BGC) i havsvattenprover (metoder) kända för sin biosyntetiska potential, såsom cyanobakterier (Synechococcus) och Proteus-bakterier, såsom Tistrella32,33, eller nyligen uppmärksammats för deras naturprodukter .såsom Myxococcota (Sandaracinaceae), Rhodococcus och Planctomycetota34,35,36.Intressant nog hittade vi flera tidigare outforskade linjer i dessa klader.Till exempel tillhörde de arter med den rikaste biosyntetiska potentialen i phyla Planctomycetota och Myxococcota okarakteriserade kandidatorder respektive släkten (kompletterande tabell 3).Sammantaget tyder detta på att OMD ger tillgång till tidigare okänd fylogenetisk information, inklusive mikroorganismer, som kan representera nya mål för upptäckt av enzymer och naturliga produkter.
Därefter karakteriserade vi den BGC-berikade kladden genom att inte bara räkna det maximala antalet BGC som kodats av dess medlemmar, utan också genom att bedöma mångfalden av dessa BGC, vilket förklarar frekvensen av olika typer av naturliga kandidatprodukter (Fig. 2c och metoder). )..Vi fann att de mest biosyntetiskt olika arterna representerades av speciellt konstruerade bakteriella MAG i denna studie.Dessa bakterier tillhör den oodlade filum Candidatus Eremiobacterota, som förblir i stort sett outforskad bortsett från några genomiska studier37,38.Det är anmärkningsvärt att "ca.Släktet Eremiobacterota har endast analyserats i en terrestrisk miljö39 och är inte känd för att inkludera några medlemmar berikade med BGC.Här har vi rekonstruerat åtta MAG av samma art (nukleotididentitet > 99%) 23. Vi föreslår därför artnamnet "Candidatus Eudoremicrobium malaspinii", uppkallat efter nereiden (havsnymf), en vacker gåva i grekisk mytologi och expeditioner.'Ka.Enligt fylogenetisk annotation 13 har E. malaspinii inga tidigare kända släktingar under sekvensnivån och tillhör därmed en ny bakteriefamilj som vi föreslår ”Ca.E. malaspinii" som typart och "Ca.Eudormicrobiaceae” som det officiella namnet (tilläggsinformation).Kort metagenomisk rekonstruktion av 'Ca.E. malaspinii-genomprojektet validerades genom mycket låg input, långläst metagenomisk sekvensering och målinriktad sammansättning av ett enda prov (Methods) som en enda 9,63 Mb linjär kromosom med en 75 kb duplicering.som den enda återstående oklarheten.
För att fastställa det fylogenetiska sammanhanget för denna art, sökte vi efter 40 närbesläktade arter i ytterligare eukaryota-berikade metagenomiska prover från Tara Ocean-expeditionen genom riktad genomrekonstruktion.Kortfattat har vi kopplat metagenomiska läsningar till genomiska fragment associerade med "Ca.E. malaspinii” och antog att en ökad rekryteringsgrad i detta urval indikerar närvaron av andra släktingar (metoder).Som ett resultat hittade vi 10 MAG, en kombination av 19 MAG som representerar fem arter i tre släkten inom en nydefinierad familj (dvs. "Ca. Eudormicrobiaceae").Efter manuell inspektion och kvalitetskontroll (utökade data, Fig. 6 och ytterligare information) fann vi att "Ca.Eudormicrobiaceae-arter uppvisar större genom (8 Mb) och rikare biosyntetisk potential (14 till 22 BGC per art) än andra "Ca"-medlemmar.Clade Eremiobacterota (upp till 7 BGC) (Fig. 3a–c).
a, fylogenetiska positioner för de fem 'Ca.Arter av Eudormicrobiaceae visade BGC-rikedom specifik för de marina linjerna som identifierats i denna studie.Det fylogenetiska trädet inkluderar alla 'Ca.MAG Eremiobacterota och medlemmar av andra phyla (genomnummer inom parentes) tillhandahållna i GTDB (version 89) användes för evolutionär bakgrund (metoder).De yttersta lagren representerar klassificeringar på familjenivå ("Ca. Eudormicrobiaceae" och "Ca. Xenobiaceae") och på klassnivå ("Ca. Eremiobacteria").De fem arterna som beskrivs i denna studie representeras av alfanumeriska koder och föreslagna binomiska namn (tilläggsinformation).b, okej.Eudormicrobiaceae-arter delar sju vanliga BGC-kärnor.Frånvaron av BGC i A2-kladden berodde på ofullständigheten hos den representativa MAG (kompletterande tabell 3).BGC är specifika för "Ca.Amphithomicrobium" och "Ca.Amphithomicrobium” (klädsel A och B) visas inte.c, Alla BGC:er kodade som "Ca.Eudoremicrobium taraoceanii visade sig uttryckas i 623 metatranskriptomer tagna från Taras hav.Heldragna cirklar indikerar aktiv transkription.Orange cirklar anger log2-transformerade veckförändringar under och över hushållningsgenens uttryckshastighet (metoder).d, relativa överflödskurvor (metoder) som visar 'Ca.Arter av Eudormicrobiaceae är utbredda i de flesta havsbassänger och i hela vattenpelaren (från ytan till ett djup av minst 4000 m).Baserat på dessa uppskattningar fann vi att 'Ca.E. malaspinii' står för upp till 6 % av prokaryota celler i djuphavs- pelagiska spannmålsassocierade samhällen.Vi ansåg att en art fanns på en plats om den hittades i någon bråkdel av storleken på ett givet djuplager.IO – Indiska oceanen, NAO – Nordatlanten, NPO – Norra Stilla havet, RS – Röda havet, SAO – Sydatlanten, SO – Södra oceanen, SPO – Södra Stilla havet.
Studerar överflöd och distribution av Ca.Eudormicrobiaceae, som, som vi fann, dominerar i de flesta havsbassänger, liksom i hela vattenpelaren (fig. 3d).Lokalt utgör de 6 % av det marina mikrobiella samhället, vilket gör dem till en viktig del av den globala marina mikrobiomen.Dessutom hittade vi det relativa innehållet av Ca.Eudormicrobiaceae-arter och deras BGC-uttrycksnivåer var högst i den eukaryota anrikade fraktionen (Fig. 3c och utökade data, Fig. 7), vilket indikerar en möjlig interaktion med partiklar, inklusive plankton.Denna observation har viss likhet med 'Ca.Eudoremicrobium BGCs som producerar cytotoxiska naturliga produkter genom kända vägar kan uppvisa rovbeteende (tilläggsinformation och utökade data, figur 8), liknande andra rovdjur som specifikt producerar metaboliter som Myxococcus41.Upptäckten av Ca.Eudormicrobiaceae i mindre tillgängliga (djuphavs) eller eukaryota snarare än prokaryota prover kan förklara varför dessa bakterier och deras oväntade BGC-diversitet förblir oklara i samband med forskning om naturlig mat.
I slutändan försökte vi experimentellt validera löftet om vårt mikrobiombaserade arbete med att upptäcka nya vägar, enzymer och naturliga produkter.Bland de olika klasserna av BGC är RiPP-vägen känd för att koda för en rik kemisk och funktionell mångfald på grund av olika post-translationella modifieringar av kärnpeptiden av mogna enzymer42.Så vi valde två 'Ca.Eudoremicrobium' RiPP BGCs (figurerna 3b och 4a-e) är baserade på samma som alla kända BGC (\(\bar{d}\)MIBiG och \(\bar{d}\)RefSeq ovan 0.2) .
a–c, In vitro heterologt uttryck och in vitro enzymatiska analyser av ett nytt (\(\bar{d}\)RefSeq = 0,29) kluster av RiPP-biosyntes som är specifik för Ca-arter i djuphavsområdet.E. malaspinii' ledde till produktionen av difosforylerade produkter.c, modifieringar identifierade med användning av högupplösta (HR) MS/MS (fragmentering indikerad av b- och y-joner i den kemiska strukturen) och NMR (expanderade data, fig. 9).d, denna fosforylerade peptid uppvisar låg mikromolär inhibering av neutrofilelastas från däggdjur, vilket inte finns i kontrollpeptiden och den dehydratiserande peptiden (dehydrering inducerad av kemiskt avlägsnande).Experimentet upprepades tre gånger med liknande resultat.Till exempel belyser heterologt uttryck av ett andra nytt \(\bar{d}\)RefSeq = 0,33) kluster av proteinbiosyntes funktionen hos fyra mogna enzymer som modifierar kärnpeptiden med 46 aminosyror.Rester färgas enligt modifieringsställe som förutspåtts av HR-MS/MS, isotopmärkning och NMR-analys (kompletterande information).Streckad färgning indikerar att modifieringen sker vid någon av de två resterna.Figuren är en sammanställning av många heterologa konstruktioner för att visa aktiviteten hos alla mogna enzymer på samma kärna.h, Illustration av NMR-data för ryggradsamid-N-metylering.Fullständiga resultat visas i fig.10 med utökade data.i, Fylogenetisk position för det mogna FkbM-proteinklusterenzymet bland alla FkbM-domäner som finns i MIBiG 2.0-databasen avslöjar ett enzym från denna familj med N-metyltransferasaktivitet (tilläggsinformation).Schematiska diagram av BGCs (a, e), prekursorpeptidstrukturer (b, f) och förmodade kemiska strukturer av naturliga produkter (c, g) visas.
Den första RiPP-vägen (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) hittades endast i djuphavsarter "Ca.E. malaspinii” och koder för Peptid-prekursor (Fig. 4a, b).I detta mogna enzym har vi identifierat en enda funktionell domän som är homolog med dehydreringsdomänen av lantipeptidsyntas som normalt katalyserar fosforylering och efterföljande avlägsnande av 43 (tilläggsinformation).Därför förutspår vi att modifieringen av prekursorpeptiden involverar en sådan tvåstegs dehydrering.Men med hjälp av tandemmasspektrometri (MS/MS) och kärnmagnetisk resonansspektroskopi (NMR), identifierade vi en polyfosforylerad linjär peptid (Fig. 4c).Även om det var oväntat hittade vi flera bevis för att det är slutprodukten: två olika heterologa värdar och ingen dehydrering i in vitro-analyser, identifiering av nyckelrester muterade i det katalytiska dehydreringsstället för det mogna enzymet.alla rekonstruerade av "Ca".E. malaspinii-genomet (utökade data, Fig. 9 och ytterligare information) och slutligen den biologiska aktiviteten hos den fosforylerade produkten, men inte den kemiskt syntetiserade dehydratiserade formen (Fig. 4d).I själva verket fann vi att det uppvisar en låg mikromolär proteashämmande aktivitet mot neutrofil elastas, jämförbar med andra relaterade naturprodukter i koncentrationsintervallet (IC50 = 14,3 μM) 44, trots att den ekologiska rollen återstår att belysa.Baserat på dessa resultat föreslår vi att vägen namnges "fosfeptin".
Det andra fallet är en komplex RiPP-väg specifik för 'Ca.Släktet Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) förutspåddes koda för naturliga proteinprodukter (Fig. 4e).Dessa vägar är av särskilt biotekniskt intresse på grund av den förväntade tätheten och variationen av ovanliga kemiska modifieringar som etablerats av enzymerna som kodas av de relativt korta BGCs45.Vi fann att detta protein skiljer sig från tidigare karakteriserade proteiner genom att det saknar både huvud-NX5N-motivet av polyceramider och lantionin-loopen av landornamider 46 .För att övervinna begränsningarna hos vanliga heterologa uttrycksmönster använde vi dem tillsammans med ett anpassat Microvirgula aerodenitrificans-system för att karakterisera fyra mogna enzymer (metoder).Genom att använda en kombination av MS/MS, isotopmärkning och NMR upptäckte vi dessa mogna enzymer i peptidens kärna med 46 aminosyror (Fig. 4f, g, utökade data, Fig. 10–12 och ytterligare information).Bland mogna enzymer karakteriserade vi det första uppträdandet av en FkbM O-metyltransferasfamiljemedlem 47 i RiPP-vägen och fann oväntat att detta mogna enzym introducerar ryggrads-N-metylering (Fig. 4h, i och ytterligare information).Även om denna modifiering är känd i naturliga NRP48-produkter, är enzymatisk N-metylering av amidbindningar en komplex men bioteknologiskt signifikant reaktion49 som hittills har varit av intresse för RiPP-familjen av borosiner.Specificitet 50,51.Identifieringen av denna aktivitet i andra familjer av enzymer och RiPP kan öppna upp för nya tillämpningar och utöka den funktionella mångfalden av proteiner 52 och deras kemiska mångfald.Baserat på de identifierade ändringarna och den ovanliga längden på den föreslagna produktstrukturen, föreslår vi ett vägnamn "pythonamid".
Upptäckten av en oväntad enzymologi i en funktionellt karakteriserad familj av enzymer illustrerar löftet om miljögenomik för nya upptäckter, och illustrerar också den begränsade kapaciteten för funktionell slutledning baserat på enbart sekvenshomologi.Sålunda, tillsammans med rapporter om icke-kanoniska bioaktiva polyfosforylerade RiPPs, visar våra resultat ett resurskrävande men kritiskt värde för syntetiska biologiska ansträngningar för att helt avslöja den funktionella rikedomen, mångfalden och ovanliga strukturerna hos biokemiska föreningar.
Här visar vi utbudet av biosyntetisk potential som kodas av mikrober och deras genomiska sammanhang i det globala marina mikrobiomet, vilket underlättar framtida forskning genom att göra den resulterande resursen tillgänglig för forskarsamhället (https://microbiomics.io/ocean/).Vi fann att mycket av dess fylogenetiska och funktionella nyhet endast kan erhållas genom att rekonstruera MAG och SAG, särskilt i underutnyttjade mikrobiella samhällen som kan vägleda framtida bioprospekteringsinsatser.Även om vi här kommer att fokusera på 'Ca.Eudormicrobiaceae" som en härstamning speciellt biosyntetiskt "begåvad", många av de BGC som förutspås i den oupptäckta mikrobiotan kodar sannolikt tidigare obeskrivna enzymologier som ger föreningar med miljömässigt och/eller bioteknologiskt betydelsefulla effekter.
Metagenomiska datamängder från stora oceanografiska studier och tidsseriestudier med tillräckligt sekvenseringsdjup inkluderades för att maximera täckningen av globala marina mikrobiella samhällen i havsbassänger, djupa lager och över tid.Dessa datauppsättningar (kompletterande tabell 1 och figur 1) inkluderar metagenomik från prover som samlats in i Tara-haven (virusberikade, n=190; prokaryota anrikade, n=180)12,22 och BioGEOTRACES-expeditionen (n=480).Hawaiian Oceanic Time Series (HOT, n = 68), Bermuda-Atlantic Time Series (BATS, n = 62)21 och Malaspina Expeditionen (n = 58)23.Sekvenseringsavläsningar från alla metagenomiska fragment filtrerades för kvalitet med hjälp av BBMap (v.38.71) genom att ta bort sekvenseringsadaptrar från läsningar, ta bort läsningar mappade till kvalitetskontrollsekvenser (PhiX-genom) och använda trimq=14, maq=20 förkastar dålig läskvalitet, maxns = 0 och minlängd = 45. Efterföljande analyser kördes eller slogs samman med QC-avläsningar om specificerat (bbmerge.sh minoverlap=16).QC-avläsningar normaliserades (bbnorm.sh-mål = 40, minddepth = 0) före byggandet med hjälp av metaSPAdes (v.3.11.1 eller v.3.12 om det behövs)53.De resulterande byggnadsställningarna (nedan kallade ställningar) filtrerades slutligen efter längd (≥1 kb).
De 1038 metagenomiska proverna delades in i grupper, och för varje grupp av prover matchades de metagenomiska kvalitetskontrollavläsningarna av alla prover med parenteserna för varje prov separat, vilket resulterade i följande antal parvisa gruppavläsningar: Tara Marine Viruses – Enriched (190×190 ), Prokaryoter berikade (180×180), BioGEOTRACES, HOT och FLADDERMÅS (610×610) och Malaspina (58×58).Kartläggning gjordes med hjälp av Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 som gör att avläsningar kan matchas till sekundära platser (med flaggan -a).Justeringar filtrerades till att vara minst 45 baser långa, ha ≥97 % identitet och spänna ≥80 % avläsningar.De resulterande BAM-filerna bearbetades med jgi_summarize_bam_contig_depths-skriptet för MetaBAT2 (v.2.12.1)55 för att ge intra- och inter-sampletäckning för varje grupp.Slutligen grupperades parenteser för att öka känsligheten genom att individuellt köra MetaBAT2 på alla prover med –minContig 2000 och –maxEdges 500. Vi använder MetaBAT2 istället för en ensembleboxer eftersom det i oberoende tester har visat sig vara den mest effektiva singelboxaren.och 10 till 50 gånger snabbare än andra vanliga boxare57.För att testa effekten av överflödskorrelationer använde ett slumpmässigt utvalt delprov av metagenomik (10 för var och en av de två Tara Ocean-datauppsättningarna, 10 för BioGEOTRACES, 5 för varje tidsserie och 5 för Malaspina) dessutom endast prover.Interna prover grupperas för att erhålla täckningsinformation.(Ytterligare information).
Ytterligare (externa) genom inkluderades i den efterföljande analysen, nämligen 830 manuellt utvalda MAG från en delmängd av Tara Oceans26 dataset, 5287 SAG från GORG20 dataset och data från MAR databasen (MarDB v. 4) från 1707 isolerade REFs och 682 SAGs) 27. För MarDB-datauppsättningen väljs genom baserat på tillgänglig metadata om provtypen matchar följande reguljära uttryck: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] isolerad'.
Kvaliteten på varje metagenomisk behållare och externa genom bedömdes med hjälp av CheckM (v.1.0.13) och Anvi'o's Lineage Workflow (v.5.5.0)58,59.Om CheckM eller Anvi'o rapporterar ≥50 % fullständighet/fullständighet och ≤10 % kontaminering/redundans, spara metagenomiska celler och externa genom för senare analys.Dessa poäng kombinerades sedan till genomsnittlig fullständighet (mcpl) och medelkontamination (mctn) för att klassificera genomkvaliteten enligt gemenskapskriterier60 enligt följande: hög kvalitet: mcpl ≥ 90 % och mctn ≤ 5 %;bra kvalitet: mcpl ≥ 70 %, mctn ≤ 10 %, medelhög kvalitet: mcpl ≥ 50 % och mctn ≤ 10 %, rimlig kvalitet: mcpl ≤ 90 % eller mctn ≥ 10 %.De filtrerade genomen korrelerades sedan med kvalitetspoäng (Q och Q') enligt följande: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (stamvariabilitet)/100 + 0,5 x log[N50] .(implementerat i dRep61).
För att möjliggöra jämförande analys mellan olika datakällor och genomtyper (MAG, SAG och REF), 34 799 genom urskiljdes baserat på genomomfattande genomsnittlig nukleotididentitet (ANI) med användning av dRep (v.2.5.4).Upprepar)61 med 95% ANI-trösklar28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) och enkelkopia markörgener som använder SpecI63 som tillhandahåller genomklustring på artnivå.Ett representativt genom valdes ut för varje dRep-kluster enligt den maximala kvalitetspoängen (Q') definierad ovan, som ansågs representativ för arten.
För att utvärdera kartläggningshastigheten användes BWA (v.0.7.17-r1188, -a) för att kartlägga alla 1038 uppsättningar av metagenomiska avläsningar med 34 799 genom som ingår i OMD.Kvalitetskontrollerade avläsningar kartlades i single-end-läge och de resulterande justeringarna filtrerades för att endast bibehålla anpassningar ≥45 bp i längd.och identitet ≥95%.Visningsförhållandet för varje prov är procentandelen av avläsningar som återstår efter filtrering dividerat med det totala antalet kvalitetskontrollavläsningar.Med samma tillvägagångssätt reducerades var och en av de 1038 metagenomerna till 5 miljoner insättningar (utökade data, Fig. 1c) och matchades till GORG SAG i OMD och i alla GEM16.Mängden MAG som återvunnits från havsvatten i GEM16-katalogen bestämdes genom sökordsfrågor från metagenomiska källor, val av havsvattenprover (t.ex. i motsats till marina sediment).Specifikt väljer vi "aquatic" som "ecosystem_category", "marine" som "ecosystem_type" och filtrerar "habitat" som "djupa hav", "marin", "maritim oceanisk", "pelagisk marin", "marinvatten" , "Ocean", "Havsvatten", "Ythavsvatten", "Ythavsvatten".Detta resulterade i 5903 MAG (734 hög kvalitet) fördelade på 1823 OTU:er (visningar här).
Prokaryota genom annoterades taxonomiskt med användning av GTDB-Tk (v.1.0.2)64 med standardparametrar inriktade på GTDB r89 version 13. Anvi'o användes för att identifiera eukaryota genom baserat på domänförutsägelse och återkallelse ≥50 % och redundans ≤ 10 %.Den taxonomiska annoteringen av en art definieras som ett av dess representativa genom.Med undantag för eukaryoter (148 MAG), annoterades varje genom först funktionellt med hjälp av prokka (v.1.14.5)65, namngivning av kompletta gener, definition av parametrar för "archaea" eller "bakterier", vilket också rapporteras för icke- kodande gener.och CRISPR-regioner, bland andra genomiska egenskaper.Annotera predikterade gener genom att identifiera universella enkelkopia-markörgener (uscMG) med fetchMG (v.1.2)66, tilldela ortologgrupper och fråga med hjälp av emapper (v.2.0.1)67 baserat på eggNOG (v.5.0)68.KEGG-databasen (publicerad 10 februari 2020) 69. Det sista steget utfördes genom att matcha proteiner till KEGG-databasen med DIAMOND (v.0.9.30)70 med en fråga och ämnestäckning på ≥70 %.Resultaten filtrerades ytterligare enligt NCBI Prokaryotic Genome Annotation Pipeline71 baserat på bithastighet ≥ 50% av maximal förväntad bithastighet (länk själv).Gensekvenser användes också som input för att identifiera BGCs i genomet med hjälp av antiSMASH (v.5.1.0)72 med standardparametrar och olika klusterexplosioner.Alla genom och anteckningar har sammanställts till OMD tillsammans med kontextuell metadata tillgänglig på webben (https://microbiomics.io/ocean/).
I likhet med tidigare beskrivna metoder12,22 använde vi CD-HIT (v.4.8.1) för att gruppera >56,6 miljoner proteinkodande gener från bakteriella och arkeala genom från OMD till 95 % identitet och kortare gener (90 % täckning)73 upp till >17,7 miljoner genkluster.Den längsta sekvensen valdes som representativ gen för varje genkluster.De 1038 metagenomerna matchades sedan till >17,7 miljoner BWA (-a)-klustermedlemmar och de resulterande BAM-filerna filtrerades för att endast behålla anpassningar med ≥95 % procent identitet och ≥45 basanpassningar.Längdnormaliserad genöverflöd beräknades genom att först räkna inserts från den bästa unika anpassningen och sedan, för fuzzy mappade inserts, lägga till fraktionerad antal till motsvarande målgener proportionellt mot deras antal unika inserts.
Genomerna från den utökade OMD (med ytterligare MAG från "Ca. Eudormicrobiaceae", se nedan) lades till mOTUs74-databasen för metagenomiska analysverktyg (v.2.5.1) för att skapa en utökad mOTU-referensdatabas.Endast sex enkelkopia genom (23 528 genom) överlevde av tio uscMGs.Utbyggnaden av databasen resulterade i 4 494 ytterligare kluster på artnivå.1038 metagenomer analyserades med standardmOTU-parametrar (v.2).Totalt 989 genom som fanns i 644 mOTU-kluster (95% REF, 5% SAG och 99,9% tillhörande MarDB) upptäcktes inte av mOTU-profilen.Detta återspeglar olika ytterligare källor till marin isolering av MarDB-genomen (de flesta av de oupptäckta genomen är associerade med organismer isolerade från sediment, marina värdar, etc.).För att fortsätta fokusera på den öppna havsmiljön i denna studie, uteslöt vi dem från nedströmsanalysen om de inte upptäcktes eller inkluderades i den utökade mOTU-databasen som skapades i denna studie.
Alla BGC från MAG, SAG och REF i OMD (se ovan) kombinerades med BGC som identifierades i alla metagenomiska ställningar (antiSMASH v.5.0, standardparametrar) och karakteriserades med hjälp av BiG-SLICE (v.1.1) (PFAM-domän )75.Baserat på dessa funktioner beräknade vi alla cosinusavstånd mellan BGC och grupperade dem (medellänkar) i GCF och GCC med avståndströsklar på 0,2 respektive 0,8.Dessa trösklar är en anpassning av tröskelvärden som tidigare använts med euklidiskt avstånd75 tillsammans med cosinusavstånd, vilket lindrar en del av felen i den ursprungliga BiG-SLICE-klustringsstrategin (tilläggsinformation).
BGC filtrerades sedan för att endast behålla ≥5 kb kodad på byggnadsställningar för att minska risken för fragmentering som tidigare beskrivits16 och för att utesluta MarDB REFs och SAGs som inte finns i 1038 metagenomer (se ovan).Detta resulterade i att totalt 39 055 BGC kodades av OMD-genomet, med ytterligare 14 106 identifierade på metagenomiska fragment (dvs inte kombinerade till MAG).Dessa "metagenomiska" BGC användes för att uppskatta andelen av marin mikrobiom biosyntespotential som inte fångades i databasen (tilläggsinformation).Varje BGC karakteriserades funktionellt enligt prediktiva produkttyper definierade av anti-SMASH eller grövre produktkategorier definierade i BiG-SCAPE76.För att förhindra provtagningsbias vid kvantifiering (taxonomisk och funktionell sammansättning av GCC/GCF, avstånd mellan GCF och GCC till referensdatabaser och metagenomisk förekomst av GCF), genom att endast behålla den längsta BGC per GCF för varje art, deduplicerades 39 055 BGC ytterligare, vilket resulterade i totalt 17 689 BGC.
Nyheten hos GCC och GCF bedömdes baserat på avståndet mellan den beräknade databasen (RefSeq-databasen i BiG-FAM)29 och den experimentellt verifierade (MIBIG 2.0)30 BGC.För var och en av de 17 689 representativa BGC:erna valde vi det minsta cosinusavståndet till respektive databas.Dessa minimiavstånd beräknas sedan medelvärde (medelvärde) enligt GCF eller GCC, beroende på vad som är lämpligt.En GCF anses vara ny om avståndet till databasen är större än 0,2, vilket motsvarar en idealisk separation mellan (genomsnittlig) GCF och referensen.För GCC väljer vi 0,4, vilket är två gånger tröskeln som definieras av GCF, för att låsa in en långsiktig relation med länkar.
Den metagenomiska förekomsten av BGC uppskattades som den genomsnittliga förekomsten av dess biosyntetiska gener (som bestämts av anti-SMASH) tillgängliga från profiler på gennivå.Den metagenomiska förekomsten av varje GCF eller GCC beräknades sedan som summan av representativa BGCs (av 17 689).Dessa överflödskartor normaliserades därefter för cellulär sammansättning med användning av mOTU-räkningen per prov, vilket också stod för sekvenseringsansträngningar (utökade data, Fig. Id).Prevalensen av GCF eller GCC beräknades som procentandelen prover med ett överflöd > 0.
Det euklidiska avståndet mellan prover beräknades från den normaliserade GCF-profilen.Dessa avstånd reducerades i storlek med UMAP77 och de resulterande inbäddningarna användes för oövervakad densitetsbaserad klustring med HDBSCAN78.Det optimala minsta antalet poäng för ett kluster (och därmed antalet kluster) som används av HDBSCAN bestäms genom att maximera den kumulativa sannolikheten för klustermedlemskap.De identifierade klustren (och ett slumpmässigt balanserat delprov av dessa kluster för att ta hänsyn till bias i permutationell multivariat variansanalys (PERMANOVA)) testades för signifikans mot oreducerade euklidiska avstånd med PERMANOVA.Den genomsnittliga genomstorleken för proverna beräknades baserat på den relativa förekomsten av mOTU och den uppskattade genomstorleken för medlemmarna i genomen.I synnerhet uppskattades den genomsnittliga genomstorleken för varje mOTU som medelvärdet av genomstorlekarna för dess medlemmar korrigerat för fullständighet (efter filtrering) (till exempel har ett 75 % komplett genom med en längd på 3 Mb en justerad storlek på 4 Mb).för medelgenom med integritet ≥70 %.Den genomsnittliga genomstorleken för varje prov beräknades sedan som summan av mOTU-genomstorlekar viktade med relativ överflöd.
En filtrerad uppsättning av genomkodade BGCs i OMD visas i bakteriella och arkeala GTDB-träd (i ≥5 kb ramar, exklusive REF och SAG MarDB som inte finns i 1038 metagenomer, se ovan) och deras förutsagda produktkategorier baserat på fylogenetiken genomets position (se ovan).Vi reducerade först data per art, och använde genomet med flest BGCs i den arten som representativt.För visualisering delades representanterna ytterligare in i trädgrupper, och återigen, för varje cellad kladde, valdes genomet som innehöll det största antalet BGCs som en representant.BGC-berikade arter (minst ett genom med >15 BGC) analyserades ytterligare genom att beräkna Shannon Diversity Index för produkttyperna som kodas i dessa BGC.Om alla förutsagda produkttyper är desamma anses kemiska hybrider och andra komplexa BGC (som förutsägs av anti-SMAH) tillhöra samma produkttyp, oavsett deras ordning i klustret (t.ex. protein-bakteriocin och bakteriocin-proteoproteinfusion kropp).hybrid).
Återstående DNA (beräknad till 6 ng) från Malaspina-prov MP1648, motsvarande biologiskt prov SAMN05421555 och matchat till Illumina SRR3962772 metagenomisk lässet för kort läsning, bearbetad enligt PacBio-sekvenseringsprotokoll med ultralåg ingång för att använda PacBio-provet gDNA-prov kit (100-980-000) och SMRTbell Express 2.0 mallberedningssats (100-938-900).Kortfattat klipptes det kvarvarande DNA:t, reparerades och renades (ProNex-pärlor) med användning av Covaris (g-TUBE, 52104).Renat DNA utsätts sedan för biblioteksberedning, amplifiering, rening (ProNex-pärlor) och storleksval (>6 kb, Blue Pippin) före ett sista reningssteg (ProNex-pärlor) och sekvensering på Sequel II-plattformen.
Rekonstruktion av de två första ca.För MAG Eremiobacterota identifierade vi ytterligare sex ANI >99% (dessa ingår i figur 3), som initialt filtrerades baserat på kontamineringspoäng (senare identifierade som gendupliceringar, se nedan).Vi hittade också en bricka märkt "Ca".Eremiobacterota” från olika studier23 och använde dem tillsammans med åtta MAG från vår studie som referens för metagenomiska avläsningar från 633 eukaryota berikade (>0,8 µm) prover med BWA (v.0.7.17) Ref -r1188, – en flagga) för nedsamplade kartläggning (5 miljoner läsningar).Baserat på anrikningsspecifika kartor (filtrerade med 95 % anpassningsidentitet och 80 % lästäckning), valdes 10 metagenom (förväntad täckning ≥5×) ut för montering och ytterligare 49 metagenomer (förväntad täckning ≥1×) för innehållskorrelation.Med användning av samma parametrar som ovan, lagrades dessa prover och 10 ytterligare 'Ca's tillsattes.MAG Eremiobacterota har återställts.Dessa 16 MAG (de två som redan finns i databasen räknas inte med) bringar det totala antalet genom i den utökade OMD till 34 815.MAG:er tilldelas taxonomiska rangordningar baserat på deras genomiska likhet och position i GTDB.18 MAG avlägsnades med hjälp av dRep i 5 arter (intraspecifik ANI >99%) och 3 släkten (intragenerisk ANI 85% till 94%) inom samma familj79.Artrepresentanter valdes ut manuellt baserat på integritet, kontaminering och N50.Föreslagen nomenklatur finns i den kompletterande informationen.
Bedöm integriteten och kontamineringen av 'Ca.MAG Eremiobacterota, bedömde vi närvaron av uscMG, såväl som härstamnings- och domänspecifika enkelkopia-markörgenuppsättningar som används av CheckM och Anvi'o.Identifieringen av 2 dubbletter av 40 uscMGs bekräftades genom fylogenetisk rekonstruktion (se nedan) för att utesluta eventuell kontaminering (detta motsvarar 5% baserat på dessa 40 markörgener).En ytterligare studie av fem representativa MAGs 'Ca.Den låga nivån av föroreningar i dessa rekonstruerade genom bekräftades för Eremiobacterota-arter med användning av det interaktiva Anvi'o-gränssnittet baserat på överflöd och sekvenssammansättningskorrelationer (tilläggsinformation)59.
För fylogenomisk analys valde vi fem representativa MAGs "Ca".Eudormicrobiaceae”, alla arter “Ca.Genomet av Eremiobacterota och medlemmar av andra phyla (inklusive UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria och Planctomycetota) är tillgängligt från GTDB (r89)13.Alla dessa genom kommenterades som tidigare beskrivits för extraktion av enkelkopiemarkörgen och BGC-annotering.GTDB-genomen konserverades enligt ovanstående integritets- och kontamineringskriterier.Fylogenetisk analys utfördes med hjälp av Anvi'o Phylogenetics59-arbetsflödet.Trädet konstruerades med användning av IQTREE (v.2.0.3) (standardalternativ och -bb 1000)80 på en inriktning av 39 tandem ribosomala proteiner identifierade av Anvi'o (MUSCLE, v.3.8.1551)81.Hans positioner reducerades.för att täcka minst 50 % av genomet82 och Planctomycecota användes som en utgrupp baserad på GTDB-trädtopologin.Ett träd på 40 uscMG byggdes med samma verktyg och parametrar.
Vi använde Traitar (v.1.1.2) med standardparametrar (fenotyp, från nukleotider)83 för att förutsäga vanliga mikrobiella egenskaper.Vi utforskade en potentiell rovdjurslivsstil baserad på ett tidigare utvecklat rovdjursindex84 som beror på innehållet av en proteinkodande gen i genomet.Specifikt använder vi DIAMOND för att jämföra proteiner i arvsmassan mot OrthoMCL-databasen (v.4)85 med hjälp av alternativen –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 OCH räkna generna som motsvarar markörgenerna för rovdjur och icke-rovdjur.Indexet är skillnaden mellan antalet rov- och icke rov-markeringar.Som en ytterligare kontroll analyserade vi också "Ca"-genomet.Entotheonella TSY118-faktorn är baserad på dess association med Ca.Eudoremicrobium (stor genomstorlek och biosyntetisk potential).Därefter testade vi potentiella kopplingar mellan predator- och icke-predatormarkörgener och den biosyntetiska potentialen hos Ca.Eudormicrobiaceae” och fann att inte mer än en gen (från någon typ av markörgen, dvs predator/icke-predator-gen) överlappar med BGC, vilket tyder på att BGC inte förväxlar predationssignaler.Ytterligare genomisk annotering av förvrängda replikoner utfördes med TXSSCAN (v.1.0.2) för att specifikt undersöka sekretionssystemet, pili och flagella86.
Fem representativa 'Ca's kartlades genom att kartlägga 623 metatranskriptomer från de prokaryota och eukaryota anrikningsfraktionerna i Tara-haven22,40,87 (med BWA, v.0.7.17-r1188, -a flagga).Eudormicrobiaceae genom.BAM-filer bearbetades med FeatureCounts (v.2.0.1)88 efter 80 % lästäckning och 95 % identitetsfiltrering (med optioner featureCounts –primary -O –fraktion -t CDS,tRNA -F GTF -g ID -p ) Räknar antal insättningar per gen.De genererade kartorna normaliserades för genlängd och markörgenförekomst mOTU (längdnormaliserad genomsnittlig insättningsantal för gener med insättningsantal >0) och log-transformerades till 22,74 för att erhålla det relativa uttrycket per cell för varje gennivå, vilket också förklarar variation från prov till prov under sekvensering.Sådana förhållanden möjliggör jämförande analys, vilket mildrar sammansättningsproblem vid användning av relativ överflödsdata.Endast prover med >5 av de 10 mOTU-markörgenerna övervägdes för ytterligare analys för att tillåta en tillräckligt stor del av genomet att detekteras.
Den normaliserade transkriptomprofilen för 'Ca.E. taraoceanii utsattes för dimensionsreduktion med UMAP och den resulterande representationen användes för oövervakad klustring med HDBSCAN (se ovan) för att bestämma uttrycksstatus.PERMANOVA testar betydelsen av skillnader mellan identifierade kluster i det ursprungliga (ej reducerade) avståndsutrymmet.Differentiellt uttryck mellan dessa tillstånd testades över genomet (se ovan) och 201 KEGG-vägar identifierades i 6 funktionella grupper, nämligen: BGC, utsöndringssystem och flagellära gener från TXSSCAN, nedbrytningsenzymer (proteas och peptidaser), och rovdjur och icke- rovgener.rovindexmarkörer.För varje prov beräknade vi det normaliserade medianuttrycket för varje klass (observera att BGC-uttrycket i sig beräknas som medianuttrycket av biosyntetiska gener för det BGC) och testades för signifikans över tillstånd (Kruskal-Wallis-test justerat för FDR).
Syntetiska gener köptes från GenScript och PCR-primrar köptes från Microsynth.Phusionpolymeras från Thermo Fisher Scientific användes för DNA-amplifiering.NucleoSpin-plasmider, NucleoSpin-gel och PCR-reningskit från Macherey-Nagel användes för DNA-rening.Restriktionsenzymer och T4 DNA-ligas köptes från New England Biolabs.Andra kemikalier än isopropyl-p-d-1-tiogalaktopyranosid (IPTG) (Biosynth) och 1,4-ditiotreitol (DTT, AppliChem) köptes från Sigma-Aldrich och användes utan ytterligare rening.Antibiotikan kloramfenikol (Cm), spektinomycindihydroklorid (Sm), ampicillin (Amp), gentamicin (Gt) och karbenicillin (Cbn) köptes från AppliChem.Bacto Trypton och Bacto Yeast Extract mediakomponenter köptes från BD Biosciences.Trypsin för sekvensering köptes från Promega.
Gensekvenser extraherades från anti-SMASH förutsagt BGC 75.1.E. malaspinii (Kompletterande information).
Generna embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), och embAM (inklusive intergena regioner) konstruerades som codon5-regioner utan syntetiska 5-sekvenser och optimerade pUC7-sekvenser. utvecklad för uttryck i E när.embA-genen subklonades in i det första multipla kloningsstället (MCS1) av pACYCDuet-1(CmR) och pCDFDuet-1(SmR) med BamHI- och Hindlll-klyvningsställen.embM- och embMopt-generna (kodonoptimerade) subklonades in i MCS1 pCDFDuet-1(SmR) med BamHI och HindIII och placerades i det andra multipla kloningsstället för pCDFDuet-1(SmR) och pRSFDuet-1(KanR) (MCS2) med Ndel/ChoI.embAM-kassetten subklonades in i pCDFDuet1(SmR) med BamHI- och Hindlll-klyvningsställen.orf3/embI-genen (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) konstruerades genom överlappande förlängnings-PCR med användning av primers EmbI_OE_F_NdeI och EmbI_OE_R_XhoI, digererade med NdeI/XhoI, och ligerades in i (-1 pSCDEF-enzym) med användning av samma restriktionsenzymer (-1 pSCDEF). lementär tabell).6).Restriktionsenzymdigestion och ligering utfördes enligt tillverkarens protokoll (New England Biolabs).
Posttid: Mar-14-2023