Das Genom von Torreya grandis beleuchtet den Ursprung und die Entwicklung von Gymnospermen

Nachricht

HeimHeim / Nachricht / Das Genom von Torreya grandis beleuchtet den Ursprung und die Entwicklung von Gymnospermen

Jul 30, 2023

Das Genom von Torreya grandis beleuchtet den Ursprung und die Entwicklung von Gymnospermen

Band Nature Communications

Nature Communications Band 14, Artikelnummer: 1315 (2023) Diesen Artikel zitieren

4055 Zugriffe

21 Altmetrisch

Details zu den Metriken

Torreya-Pflanzen produzieren Trockenfrüchte mit verschiedenen Funktionen. Hier berichten wir über die 19-Gb-Genomassemblierung von T. grandis auf Chromosomenebene. Das Genom ist durch uralte Duplikationen des gesamten Genoms und wiederkehrende LTR-Retrotransposon-Ausbrüche geprägt. Vergleichende Genomanalysen enthüllen Schlüsselgene, die an der Entwicklung der Fortpflanzungsorgane, der Zellwandbiosynthese und der Samenspeicherung beteiligt sind. Es wurde festgestellt, dass zwei Gene, die eine C18-Δ9-Elongase und eine C20-Δ5-Desaturase kodieren, für die Sciadodonsäure-Biosynthese verantwortlich sind und beide in verschiedenen Pflanzenlinien mit Ausnahme von Angiospermen vorkommen. Wir zeigen, dass die histidinreichen Boxen der Δ5-Desaturase für ihre katalytische Aktivität entscheidend sind. Die Methylomanalyse zeigt, dass Methylierungstäler des T. grandis-Samengenoms Gene beherbergen, die mit wichtigen Samenaktivitäten verbunden sind, einschließlich der Zellwand- und Lipidbiosynthese. Darüber hinaus geht die Samenentwicklung mit Veränderungen der DNA-Methylierung einher, die möglicherweise die Energieproduktion ankurbeln. Diese Studie liefert wichtige genomische Ressourcen und erläutert den evolutionären Mechanismus der Sciadodonsäure-Biosynthese in Landpflanzen.

Die Entstehung von Samenpflanzen, die aus Angiospermen und Gymnospermen bestehen, markierte ein bedeutsames Ereignis in der Entwicklung der Landpflanzen und der Veränderung der Erdumgebung. Angiospermen und Gymnospermen divergierten im Unteren Mississippi1, gefolgt von einer schnellen Ausstrahlung blühender Pflanzen, was dazu führte, dass auf der Erde etwa 352.000 Arten vorhanden waren, verglichen mit nur 1000 Arten von Gymnospermen. Es gibt eine große morphologische/anatomische Vielfalt und metabolische Vielseitigkeit zwischen Angiospermen und Gymnospermen, die zugrunde liegenden genetischen und biochemischen Mechanismen sind jedoch weitgehend unklar2,3.

Torreya grandis, eine Gymnospermenart, die zu einer kleinen Gattung der Eibenfamilie (Taxaceae) gehört, ist ein nützlicher Mehrzweckbaum, der Holz, Medikamente, essbare Samen und Öl liefert4 (Abb. 1a). Die erste glaubwürdige Erwähnung von T. grandis als medizinische Quelle erscheint im Klassiker der Materia Medica während der Drei Königreiche Chinas und stammt aus dem frühen 3. Jahrhundert n. Chr.5. T. grandis ist die einzige Art der Taxaceae mit essbaren Samen, die in China aufgrund ihres einzigartigen Geschmacks und ihrer nützlichen Inhaltsstoffe seit Tausenden von Jahren als Nahrungsmittel verwendet werden5,6. Öle sind in Samen von T. grandis mit einem durchschnittlichen Gehalt von 45,80–53,16 %7 angereichert. Sciadonsäure (SCA), eine nicht durch Methylen unterbrochene ω6-Fettsäure, wurde als einer der Hauptbestandteile in der Fettsäurezusammensetzung des Kernöls gefunden7. SCA hat positive Auswirkungen auf die menschliche Gesundheit und wirkt bei der Reduzierung von Entzündungen, der Senkung von Triglyceriden, der Verhinderung von Blutgerinnseln und der Regulierung des Fettstoffwechsels8,9,10. Die Produktion von SCA wurde in verschiedenen Abstammungslinien von Gymnospermen und einer Handvoll Algen und Farnen nachgewiesen11. Allerdings kommt SCA in Blütenpflanzen im Allgemeinen nicht vor, mit Ausnahme einiger niedrigerer Pflanzenarten (z. B. Ranunculaceae)12, sodass ein Rätsel über seinen Ursprung und seine Entwicklung in grünen Pflanzen besteht.

ein Baum- und Fruchtsatz von T. grandis. Das untere Feld zeigt den verarbeiteten trockenen Samen und seinen essbaren Teil (Endosperm). b Circos-Diagramm des T. grandis-Genoms und der von den Chromosomen kodierten genomischen Merkmale. Jedes Merkmal wurde basierend auf einem 10-MB-Fenster über die Chromosomen berechnet. Farbige Sterne zeigen das Vorhandensein von Telomersequenzen am 5'- (grün) oder 3'-Ende (orange) des Chromosoms an. c Verteilung der LTR-RT-Insertionszeit. Das linke Feld zeigt alle Mitglieder der Gypsy- und Copia-Familien und das rechte Feld zeigt die sechs häufigsten Unterfamilien. d Ks-Verteilung der Orthologen zwischen T. grandis, Sequoiadendron giganteum, Ginkgo biloba und Gnetum montanum. Ks von Paralogen in T. grandis wurde mit dem Guass-Mischungsmodell angepasst und die mutmaßliche alte WGD ist angegeben. e Mikrokollinearität zwischen den Genomen von T. grandis, G. biloba und G. montanum. Quelldaten werden als Quelldatendatei bereitgestellt.

Genomsequenzen sind der Schlüssel zur Beantwortung kritischer Fragen der Pflanzenevolution. Analysen von Genomen repräsentativer Gymnospermen haben einzigartige Aspekte der Gen- und Genomentwicklung gezeigt, die sich von Blütenpflanzen unterscheiden13,14,15,16,17,18,19. Das Verständnis der biologischen und evolutionären Mechanismen der phänotypischen Diversität zwischen blühenden und nicht blühenden Pflanzen ist jedoch immer noch eine Herausforderung, was teilweise auf die begrenzte Verfügbarkeit genomischer Ressourcen von Gymnospermen zurückzuführen ist.

In dieser Studie stellen wir ein Referenzgenom im Chromosomenmaßstab für T. grandis zusammen, begleitet von Transkriptom- und Methylomprofilen in mehreren Geweben. Unsere Daten entschlüsseln durch vergleichende Genomanalysen interessante Fußabdrücke, die mit der morphologischen Vielfalt wichtiger Landpflanzenlinien verbunden sind, und entdecken und validieren zwei Schlüsselenzyme, die für die SCA-Biosynthese verantwortlich sind. Die durch diese Arbeit bereitgestellten Informationen werden für das strategische Design zur Verbesserung der SCA-Produktion nützlich sein und die Nutzung der genetischen Ressourcen von Torreya fördern.

Wir haben insgesamt 1,93 TB Illumina- und 463,7 GB PacBio HiFi-Reads für T. grandis (Ergänzungsdaten 1) generiert, was einer 96,5-fachen bzw. 23,2-fachen Abdeckung des T. grandis-Genoms mit einer geschätzten Größe von ~20 entspricht Gb gemäß der k-mer-Analyse der Illumina-Messwerte (ergänzende Abbildung 1). Die endgültige Baugruppe hatte eine Größe von 19.050.820.213 bp und umfasste 11.811 Contigs mit einer N50-Größe von 2,82 MB (Ergänzungstabelle 1). Unter Verwendung von Hi-C-Reads mit einer Abdeckung von ungefähr 106,2 × wurden 18,87 Gb (99,1 %) der zusammengesetzten Contigs in 11 Chromosomen gruppiert (Abb. 1b und ergänzende Abb. 2). Es wurde festgestellt, dass alle 11 Chromosomen mit der 101-bp-repetitiven Sequenzeinheit angereichert waren, die der Tandem-Zentromer-Satellitenwiederholung ähnelt, die als Wahrzeichen der Zentromere bekannt ist, während 9 Chromosomen an mindestens einem Ende Telomersequenzen (5'-TTTAGGG-3') enthielten (Abb. 1b). Die Bewertung des T. grandis-Genoms mithilfe von Merqury20 ergab einen Konsens-Qualitätswert von 46,9, was einer Basisgenauigkeit von 99,998 % entspricht. Die BUSCO21-Auswertung ergab, dass 1386 von 1614 konservierten Landpflanzen-Orthologen erfolgreich von der T. grandis-Assemblierung erfasst wurden, was mit der anderer Gymnosperm-Genomassemblierungen vergleichbar war (Ergänzungstabelle 2). Der LTR-Assembly-Index (LAI) für das T. grandis-Genom betrug 10,7 und lag damit über dem vorgeschlagenen Standard für ein Referenzgenom22. Zusammen mit den hohen DNA- (99,48 %) und RNA- (bis zu 97,5 %) Lesekartierungsraten deuteten diese auf die hohe Qualität der T. grandis-Genomassemblierung hin.

Die Genomanordnung von T. grandis beherbergte 11,4 Gb (59,8 %) repetitive Sequenzen, von denen LTR-Retrotransposons (LTR-RTs; 87,0 %) vorherrschten, gefolgt von DNA-Transposons (7,1 %) und langen eingestreuten Kernelementen (LINEs; 3,1 %). ) (Ergänzende Daten 2). Der Anteil der Copia-LTR-RTs (11,6 %) war bei T. grandis relativ höher als bei anderen Gymnospermen, möglicherweise aufgrund kürzlich aufgetretener artspezifischer Ausbrüche in mehreren Unterfamilien von LTR-RTs (Abb. 1c). Die meisten LTR-RT-Ausdehnungen in Gymnospermen fanden vor 25 bis 7 Millionen Jahren statt (mya; ergänzende Abbildung 3a) und überschnitten sich mit der geologischen Zeit des Miozäns (23,03–5,33 mya), als die Erde in Richtung Eiszeiten abkühlte . Dies deutet auf einen möglichen Einfluss der Umwelt auf die Entwicklung der Genomgröße von Gymnospermen hin.

Im Genom von T. grandis wurden insgesamt 47.089 proteinkodierende Gene vorhergesagt, von denen 46.338 durch Homologie- und/oder Transkriptomnachweise gestützt wurden (Ergänzungstabelle 1). Die Introngröße ist bei Gymnospermen variabler als bei Angiospermen (ergänzende Abbildung 3b), was auf die Expansion von LTR-RTs zurückzuführen ist. In Pflanzen können LTR-RTs durch ungleiche Rekombination eliminiert werden, wodurch Solo-LTRs im Genom entstehen. Das Solo-LTR-Verhältnis ist hoch bei T. grandis (4,3) und anderen Gymnospermen, einschließlich Taxus wallichiana (5,5)18, Ginkgo biloba (4,26), Welwitschia mirabilis (3,87) und Gnetum montanum (2,07)16. Da die Genome von Gymnospermen mit alten LTR-RTs (10–30 Millionen Jahre) angereichert sind 14, 15, 16, 17, 18, 19, nehmen wir an, dass die Eliminierung alter LTR-RTs ohne kürzlich erfolgte Erweiterung möglicherweise zu ihrem hohen Solo-Intakt-LTR beigetragen hat Verhältnisse. Dies steht im Gegensatz zu den Angiospermen mit kleinem Genom, bei denen LTR-RT-Ausbrüche jünger sind (<4 Millionen Jahre)24. Die epigenetische Stummschaltung von Transposons und perizentromeren Wiederholungen wird durch RNA-gesteuerte DNA-Methylierung (RdDM) und 24-nt-hetsiRNAs25 vermittelt. Das Genom von T. grandis kodierte Homologe von Schlüsselkomponenten des RdDM-Signalwegs (Supplementary Data 3); Kleine RNA-Profile von sieben Geweben zeigten jedoch, dass 21-nt-sRNAs in T. grandis am häufigsten vorkamen, im Gegensatz zu den am häufigsten vorkommenden 24-nt-sRNAs in Angiospermen, während die Produktion von 22-nt- und 24-nt-sRNAs gewebespezifisch war (Ergänzende Abbildung 4). Dieses Muster ähnelt dem bei Nadelbäumen13,26 und Welwitschia mirabilis16 gefundenen Muster. Dennoch würden weitere umfangreiche Probenentnahmen aus weiteren Geweben und Stadien tiefere Einblicke in die Divergenz der sRNA-Verarbeitung zwischen Gymnospermen und Angiospermen liefern.

Duplikationen des gesamten Genoms (WGDs) sind in der gesamten Phylogenie der Eukaryoten aufgetreten27. Bei Gymnospermen wurden mehrere WGDs erkannt, obwohl einige von ihnen weiterhin umstritten sind16,17,18,19,28. Die Ks-Verteilung von 3859 Paraloggruppen innerhalb von T. grandis deutete auf das Fehlen aktueller WGDs hin. Wir beobachteten jedoch einen Ks-Spitzenwert im Bereich von 1 bis 2 und einen Gipfel bei 1,4, was eine mögliche alte WGD darstellt, die beim gemeinsamen Vorfahren von Nadelbäumen und Ginkgophyten auftrat, einer Abstammungslinie, die von Gnetophyten abweicht (Abb. 1d). Anschließend verwendeten wir einen baumbasierten Ansatz29, der die Häufigkeit der Genduplikation in jedem Zweig einer Phylogenie durch Abgleich von Genbaum und Artenbaum berechnet, um das WGD-Ereignis kreuzweise zu validieren. Die Analyse von 19.649 Genbäumen von acht ausgewählten Arten führte zur Entdeckung von drei alten WGD-Signalen, darunter zwei (Zeta und Omega), über die zuvor berichtet wurde, und eines, das mit der Ks-Analyse übereinstimmte (ergänzende Abbildung 5). Der Vergleich des Gesamtgenoms zeigte eine hohe Kollinearität zwischen den Genomen von T. grandis und zwei evolutionär entfernten Gymnospermen, Sequoiadendron giganteum und Ginkgo biloba (ergänzende Abbildung 6), und zeigte auch Spuren kollinearer Blöcke, die sowohl in T. grandis als auch in G. biloba dupliziert wurden jedoch nicht in Gnetum montanum, was mit dem Zeitpunkt übereinstimmt, zu dem die neu entdeckte WGD auftrat (Abb. 1e).

Wir identifizierten 19.362 orthologe Gruppen (Genfamilien) in 19 Pflanzenarten, darunter 7 Gymnospermen und 12 repräsentative Arten in wichtigen Grünpflanzenlinien. Phylogenie und molekulare Datierung unter Verwendung von 219 Genfamilien mit geringer Kopiezahl zeigten, dass sich T. grandis vor etwa 68,5 Millionen Jahren von T. wallichiana trennte (Abb. 2a). Die Erweiterung von Genfamilien steht in engem Zusammenhang mit morphologischen Innovationen30,31. Durch die Rekonstruktion der Genfamilienentwicklung stellten wir fest, dass Ausbrüche von Genfamilienerweiterungen mit großen Übergängen der Pflanzenanpassung zusammenfielen (Abb. 2a). Eine massive Erweiterung der Genfamilie (n = 417, P < 0,05) wurde beim gemeinsamen Vorfahren der Landpflanzen und anschließend bei den ausgestorbenen Vorfahren beobachtet, die zu Samenpflanzen (n = 575), Angiospermen (n = 432) und verschiedenen Abstammungslinien von Gymnospermen führte (n = 428–818). Funktionen erweiterter Genfamilien waren hauptsächlich mit der Entwicklung pflanzlicher Organe, der Reaktion auf biotischen (z. B. Bakterien und Pilze) und abiotischen (z. B. Wassermangel, Licht, Temperatur und Salz) Stress sowie der Biosynthese und Signalübertragung von Pflanzenhormonen verbunden (Ergänzende Daten). 4). Viele der Genfamilien wurden im Zuge der Evolution höherer Pflanzen kontinuierlich erweitert, was darauf hindeutet, dass die Genduplikation, möglicherweise gefolgt von einer Sub-/Neofunktionalisierung, die genetische Grundlage für die morphologische Vielfalt und Umweltanpassung in Pflanzen bildet. Unter den Genfamilien, die in T. grandis deutlich erweitert wurden, kodierten viele von ihnen für Pfam-Domänen, die mit wichtigen biologischen Funktionen verbunden sind, darunter Lipidtransfer (Oleosin und PF14368), biotische und abiotische Stressreaktionen (PF00201 und PF03018) und Sekundärstoffwechsel (PF00067). (Ergänzende Daten 5). Dem Genom von T. grandis fehlten die Orthologen der Taxadiensynthase, einer Kernkomponente der Paclitaxel-Biosynthese, was das Fehlen von Paclitaxel und relevanten Metaboliten in dieser Art erklärt.

a Erweiterung und Kontraktion der Genfamilie während der Evolution grüner Pflanzen. Die Maximum-Likelihood-Phylogenie wurde mit 219 orthologen Gruppen mit geringer Kopiezahl erstellt. Die Genfamilienanalyse wurde mit 10.345 orthologen Gruppen begonnen, die vom jüngsten gemeinsamen Vorfahren (MRCA) grüner Pflanzen gemeinsam waren. Die Zahlen auf den Zweigen geben die Größe der erweiterten (blau) und kontrahierten (rot) Genfamilien an jedem Knoten an. Die farbigen Kreise auf der rechten Seite stellen die Größe der erweiterten/kontrahierten Genfamilien sowie der gewonnenen/verlorenen Gene für jeden Blattknoten des Baums dar. b Expression von MADS-Box-Genen vom Typ MIKCC in vegetativen und reproduktiven Geweben von T. grandis. c Vorgeschlagene Gene zur Reproduktionsorganidentität in T. grandis. Die AP3/PI-ähnlichen Gene (TG7g01668 und TG7g01669) und TG8g01565 wurden vorwiegend in männlichen bzw. weiblichen Zapfen exprimiert. Die Gene AG-like (TG10g01848), AGL6-like (TG2g00325) und AP1/SEP-like (TG4g01441) wurden sowohl in weiblichen als auch in männlichen Zapfen exprimiert, wobei die ersten beiden ein Muster zeigten, das auf weibliche Zapfen ausgerichtet war. d Maximum-Likelihood-Phylogenie, die den bakteriellen Ursprung der T. grandis-Gene zeigt. Blaue Kreise zeigen an, dass die Bootstrap-Unterstützung in den entsprechenden Zweigen mehr als 80 % beträgt. e Expression mutmaßlicher horizontal übertragener Gene in verschiedenen Geweben. Quelldaten werden als Quelldatendatei bereitgestellt.

Gymnospermen haben offene oder nackte Samen auf der Oberfläche von Schuppen oder Blättern, während Blüten und Früchte Angiospermen-Neuheiten sind. Die auf Phylogenie basierende Homologensuche unter Verwendung gut untersuchter Blütenentwicklungsgene32 zeigte eine sporadische Verteilung dieser Homologen in Gymnospermen und Nicht-Samenpflanzen (Ergänzungsdaten 6), was auf die schrittweise Entstehung hinweist, die mit einem sekundären Verlust von Blütenentwicklungsgenen während der Evolution von Landpflanzen einhergeht. Dies wird durch die Gene NOP10 (erforderlich für die Bildung weiblicher Gametophyten in Blüten)33 und WUS (erforderlich für die Integrität von Spross- und Blütenmeristemen)34 veranschaulicht, die früh in Landpflanzen auftauchten und anschließend sowohl in T. grandis als auch in T. wallichiana verloren gingen (Supplementary Data 6). ).

Die Gene der MADS-Box-Familie sind eine Klasse von Transkriptionsfaktoren, die an der Regulierung der Blütenorganspezifität, der Blütezeit und der Fruchtentwicklung beteiligt sind. Wir identifizierten 23 MIKCC MADS-Box-Gene in T. grandis, einschließlich Homologen von Genen im ABCE-Modell der Blütenorganidentität35. Dazu gehörten ein AP1/SEP-ähnliches Gen (A- oder E-Funktion), zwei AP3/PI-ähnliche Gene (B-Funktion) und sechs AG-ähnliche Gene (C-Funktion) (ergänzende Abbildung 7). Die Transkriptomanalyse von 18 Proben aus vegetativen und reproduktiven Organen ergab sechs MADS-Box-Gene, die in männlichen und/oder weiblichen Zapfen von T. grandis stark exprimiert wurden, darunter die beiden tandemduplizierten AP3/PI-ähnlichen Gene (TG7g01668 und TG7g01669). vorwiegend in den männlichen Zapfen exprimiert, während ein AG-ähnliches Gen (TG10g01848) in männlichen Zapfen exprimiert wurde, in den weiblichen Zapfen jedoch um das 6,6-fache hochreguliert war (Abb. 2b). Aktuelle Studien legen nahe, dass AGL6, Mitglied einer alten Unterfamilie von MADS-Box-Genen, an der E-Funktion der Blütenentwicklung in Reis, Mais und Weizen beteiligt ist36,37, während es an der A-Funktion im basalen Angiosperm Nymphaea colorata beteiligt ist38. In T. grandis zeigte das AGL6-ähnliche Gen (TG2g00325) ein ähnliches Expressionsmuster wie die C-Funktionsgene, wohingegen das AP1/SEP-ähnliche Gen (TG4g01441) sowohl bei männlichen als auch bei weiblichen Zapfen in mäßig hohem Maße exprimiert wurde , was einer uralten Rolle der E-Funktion ähnelt. Interessanterweise wurde das am stärksten exprimierte MADS-Box-Gen (TG8g01565) ausschließlich in den weiblichen Zapfen aktiviert (Abb. 2b). Dieses Gen wurde phylogenetisch mit B-Clade-Genen geclustert, die AP3-, PI- und B-Schwestergene TT16 und GOA umfassten (ergänzende Abbildung 7); sein Expressionsmuster war jedoch dem der AP3/PI-ähnlichen Gene entgegengesetzt. Zusammenfassend stützt unser Befund über die Beteiligung zusätzlicher MADS-Box-Gene an der Samenentwicklung von Gymnospermen das grundlegende „BC“-Modell, bei dem die C-Funktionsgene im Allgemeinen in männlichen und weiblichen Fortpflanzungsorganen exprimiert werden und die B-Funktionsgene auf männliche beschränkt sind Fortpflanzungsorgane39 und legt ein ausgefeilteres Regulierungssystem für die Fortpflanzungsorganentwicklung bei Gymnospermen nahe (Abb. 2c).

Der Proteingehalt von T. grandis-Samen liegt je nach Sorte zwischen 10,34 % und 16,43 %7. Gene, die für Samenspeicherproteine ​​(SSPs) kodieren, einschließlich 2S-Albuminen (n = 0–7), 7S-Globulinen (n = 1–9) und 11S-Globulinen (n = 2–14), wurden in T. grandis und anderen Gymnospermen identifiziert, jedoch nicht in die früheren Pflanzenformen (Supplementary Data 7), was auf ihren Ursprung in Samenpflanzen schließen lässt. Die Transkriptomanalyse zeigte, dass Gene, die für 2S-Albumine und 7S-Globuline kodieren, im Kern von T. grandis-Samen in außergewöhnlich hohem Maße exprimiert wurden (durchschnittliche Transkripte pro Million (TPM) = 14.125) und dass die Expression während der Samenentwicklung erhöht war (ergänzende Abbildung 8a). ). Im Gegensatz dazu blieben alle SSP-Gene, einschließlich der 11S-Globulin-Gene, die im Kern mäßig exprimiert wurden, in den vegetativen Geweben transkriptionell inaktiv (ergänzende Abbildung 8a). Die 2S-Albuminproteine ​​beherbergen zahlreiche Cysteinreste, um innerhalb und zwischen Untereinheiten Disulfidbrücken zu bilden40. Wir fanden heraus, dass alle diese Reste in T. grandis konserviert waren, obwohl die gesamten Proteinsequenzen erheblich von den Angiospermen-Gegenstücken abwichen (ergänzende Abbildung 8b). Die Homologiemodellierung ergab einen hohen Grad an Proteinstrukturkonservierung zwischen den 2S-Albuminproteinen von T. grandis (z. B. TG11g02972) und Sonnenblumen, insbesondere in der Region, in der α-Helices gebildet werden (ergänzende Abbildung 8c). Ebenso waren die meisten Rückstände, die an der Trimerbildung und -stabilisierung sowie an der korrekten globulären Faltung von 11S-Globulinen aus Blütenpflanzen beteiligt sind, in T. grandis konserviert (ergänzende Abbildung 9). Insgesamt deuten die Genexpressions- und Strukturanalysen auf eine konservative Rolle der wichtigsten SSPs sowohl bei Gymnospermen als auch bei Angiospermen hin.

Gymnospermen sind hauptsächlich Holzpflanzen, und ihre Genome kodieren für einen großen Satz kohlenhydrataktiver Enzyme (CAZymes), deren Funktionen eng mit der Zellwandbiosynthese verbunden sind. Unter den 19 ausgewählten repräsentativen Pflanzenarten beherbergte T. grandis mehr CAZyme als die meisten anderen, insbesondere in den Familien der Glycosidhydrolasen (z. B. GH1, GH16, GH18, GH19, GH27, GH71, GH99 und GH152), GT61-Glycosyltransferasen und PL1-Polysaccharidlyasen (Supplementary Data 7), von denen viele auch in anderen Gymnospermen expandiert wurden. Im Gegensatz zu den meisten CAZyme-Familien, die überall in Pflanzen vorkommen, identifizierten wir vier Familien mit 18 Genen: GH71 (n = 7), GH99 (n = 9), GH103 (n = 1) und CE4 (n = 1). die nur in Gymnospermen und früheren Abstammungslinien vorhanden waren, nicht jedoch in Angiospermen (Ergänzende Daten 8). Die phylogenetische Analyse ergab, dass diese Familien möglicherweise bakteriellen Ursprungs waren (Abb. 2d und ergänzende Abb. 10). Durch systematische Analyse identifizierten wir 14 zusätzliche T. grandis-Gene, die aus horizontalen Gentransfers (HGTs; Ergänzungstabelle 3) stammten. Die meisten dieser Gene wurden in verschiedenen Geweben der Pflanze exprimiert (Abb. 2e), was den Beitrag von HGTs zur Evolution von Landpflanzen verstärkt.

Lignin ist ein Hauptbestandteil der sekundären Zellwand von Pflanzen und wird aus p-Hydroxyphenyl (H), Guaiacyl (G) und Syringyl (S) Monolignolen abgeleitet. S-Lignin ist auf Blütenpflanzen und einige Lykophyten beschränkt, während G- und H-Lignin für alle Gefäßpflanzen von grundlegender Bedeutung sind2. Konsequenterweise wurden zwei Schlüsselgene für die S-Lignin-Biosynthese, F5H und COMT, nur in Angiospermen, nicht jedoch in Gymnospermen gefunden. Im Gegensatz zu Angiospermen, bei denen Gefäße die wichtigsten wasserleitenden Elemente im Xylem darstellen43, bestehen Gymnospermenwälder hauptsächlich aus Tracheiden2. Die Gefäßdifferenzierung wird durch VASCULAR-RELATED MAC-DOMAIN (VND)-Proteine ​​reguliert44, während die Faserentwicklung mit NAC SECONDARY WALL THICKENING PROMOTING FACTOR (NST)/SECONDARY WALL-ASSOCIATED NAC DOMAIN (SND)-Proteinen45 assoziiert ist. Das Genom von T. grandis kodierte Gene, die zu VND4/5/6 homolog waren, es fehlten jedoch Homologe von VND1/2/3, NST und SND1 (ergänzende Abbildung 11), was mit der Entdeckung divergierender regulatorischer Netzwerke von VND/NST-Homologen einherging in Nadelbäumen und Blütenpflanzen während der Holzbildung46, deutet auf einen engen Zusammenhang zwischen der Gefäßbildung und der Entstehung von Master-NAC-Transkriptionsfaktoren sowie deren regulatorischen Netzwerken in Angiospermen hin.

Sciadonsäure (SCA) ist eine Δ5-olefinische Fettsäure und ihre Biosynthese erfordert die Aktivität von C18 Δ9-Elongase und C20 Δ5-Desaturase, die 18:2-Phosphatidylcholin (PC) als Ausgangssubstrat verwendet (Abb. 3a). Δ5-Desaturasen sind als „Front-End“-Desaturasen bekannt47, die normalerweise eine Cytochrom-b5-ähnliche Häm/Steroid-Bindungsdomäne (PF00173) und eine Fettsäure-Desaturasedomäne (PF00487) kodieren, während die Δ9-Elongasen ein GNS1/SUR4 kodieren Familiendomäne (PF01151) für die Verlängerung langkettiger Fettsäuren. Das T. grandis-Genom kodierte basierend auf der Domänensuche vier Desaturase-Gene und vier Elongase-Gene. Allerdings zeigte nur eine Desaturase (TgDES1) eine hohe Ähnlichkeit mit der zuvor berichteten Δ5-Desaturase in Anemone leveillei48, während zwei Elongasen als mutmaßliche Δ9-Elongasen angesehen wurden, aber nur eine (TgELO1) in Samenkörnern stark exprimiert wurde (ergänzende Abbildung 12). . Da die ungesättigten Fettsäuren reichlich Bestandteile von Samenölen sind, untersuchten wir die Expression von TgDES1 und TgELO1 während der Samenreifung. Wir fanden heraus, dass SCA in reifen Samen akkumuliert wurde, begleitet von einer erhöhten Expression von TgDES1. Ein ähnlicher Trend wurde für die Expression von TgELO1 und den Gehalt seines mutmaßlichen Produkts cis-11,14-Eicosadiensäure beobachtet (Abb. 3b, c). Die Untersuchung der subzellulären Lokalisierung zeigte, dass sowohl TgELO1 als auch TgDES1 zusammen mit dem Marker des endoplasmatischen Retikulums (ER) in N. benthamiana-Blättern lokalisiert waren (Abb. 3d), was darauf hindeutet, dass sie an die ER-Membran gebunden waren, was mit der bekannten subzellulären Position übereinstimmt Desaturasen und Elongasen49. Um ihre Funktion in der SCA-Biosynthese weiter zu verifizieren, haben wir sowohl TgELO1 als auch TgDES1 in A. thaliana überexprimiert, das weder Orthologe von TgELO1 und TgDES1 kodiert noch SCA oder seinen Vorläufer 20:2Δ11,14-PC produziert. Die gaschromatographische Analyse zeigte, dass SCA in Samen der transgenen Linie, die TgDES1 und TgELO1 exprimierte, erfolgreich synthetisiert wurde, was zeigt, dass TgELO1 und TgDES1 in der Lage sind, SCA in T. grandis zu synthetisieren (Abb. 3e).

a Überblick über den Biosyntheseweg der Fettsäuren. PDH-Pyruvat-Dehydrogenase, CT-Carboxyltransferase, BC-Biotin-Carboxylase, BCCP-Biotin-Carboxyl-Trägerprotein, MCMT-Malonyl-CoA:ACP-Malonyltransferase, ACP-Acyl-Trägerprotein, KAS-Ketoacyl-ACP-Synthase, SAD-Stearoyl-ACP-Desaturase, FATA-Acyl-ACP-Thioesterase A, FATB Acyl-ACP-Thioesterase B, LACS langkettige Acyl-CoA-Synthetase, DGAT-Diacylglycerin-Acyltransferase, PDAT-Phospholipid:Diacylglycerin-Acyltransferase, PAP-Phosphatidsäure-Phosphatase, LPAT-Lysophosphatidsäure-Acyltransferase, GPAT-Glycerin-3-Phosphat-Acyltransferase, CPT-Cholinphosphotransferase, FAD2-Oleat-Desaturase, FAD3-Linoleat-Desaturase, PC-Phosphatidylcholin. b TgDES1-Expression und SCA-Gehalt in Samen vom frühen Entwicklungsstadium (Mai) bis zum Reifestadium (September). Verschiedene Buchstaben auf den Balken geben die statistische Signifikanz zwischen den Proben bei α = 0,05 an (einfaktorielle ANOVA und Tukey-Test). Die Messungen wurden in drei biologischen Replikaten durchgeführt und die Daten werden als Mittelwert + Standardabweichung dargestellt. c Expression von TgELO1 und der Gehalt seines Produkts cis-11,14-Eicosadiensäure in Samen. Verschiedene Buchstaben auf den Balken geben die statistische Signifikanz zwischen den Proben bei α = 0,05 an (einfaktorielle ANOVA und Tukey-Test). Die Messungen wurden in drei biologischen Replikaten durchgeführt und die Daten werden als Mittelwert + Standardabweichung dargestellt. d Subzelluläre Lokalisierung von TgDES1 und TgELO1 in N. benthamiana-Blättern. e Nachweis von SCA und seinem Vorläufer in Arabidopsis Col-0 und der transgenen Linie, die sowohl TgDES1 als auch TgELO1 überexprimiert. Quelldaten werden als Quelldatendatei bereitgestellt.

Die phylogenetische Analyse von Desaturasen in Grünpflanzen (Viridiplantae) zeigte, dass TgDES1 ausschließlich mit Desaturasen von Nicht-Angiospermen-Organismen geclustert war und diese monophyletische Gruppe der Familie nahe stand, die Sphingolipid-Desaturasen einschließlich AtSLDs aus Arabidopsis enthielt (Abb. 4a). Interessanterweise unterschied sich die TgDES1-Klade deutlich von der Gruppe, die AL10 und AL21 beherbergte, zwei Proteine, die für die SCA-Biosynthese im basalen Eudikotylen Anemone leveillei verantwortlich waren48. Die Strukturmodellierung von TgDES1, AtSLD2 und AL21 zeigte insgesamt ähnliche Strukturen zwischen TgDES1 und AtSLD2, insbesondere in der Region, in der das aktive Zentrum gebildet wurde, wohingegen die Struktur von AL21 relativ von der von TgDES1 abwich (Abb. 4b). Da Blütenpflanzen selten SCA synthetisieren, deuten unsere phylogenetischen und strukturellen Erkenntnisse darauf hin, dass dies möglicherweise auf den Verlust von TgDES1-Clade-Desaturasen zurückzuführen ist, während die Fähigkeit der SCA-Biosynthese bei bestimmten Arten von Eudikotyledonen größtenteils auf den sekundären Anstieg der Δ5-Desaturase-Aktivität zurückgeführt wurde von evolutionär unabhängigen Gegenstücken. In ähnlicher Weise wurden enge Homologe von TgELO1 nicht in Blütenpflanzen gefunden, sondern in frühen Landpflanzen und Algen, was auf die Koevolution von Δ5-Desaturase und Δ9-Elongase in Pflanzen schließen lässt (ergänzende Abbildung 13).

a Maximum-Likelihood-Phylogenie pflanzlicher Desaturasen. TgDES1 ist innerhalb einer Gruppe (Klade 1) in der Nähe einer Schwestergruppe (Klade 2) geclustert, die Δ6- und Δ8-Desaturasen umfasst. b Strukturmodellierung von TgDES1 und den Desaturasen aus Arabidopsis (AtSLD2) und Anemone leveillei (AL21). Proteinstrukturen wurden mit AlphaFold2 modelliert und das bioaktive Zentrum jedes Proteins, das drei histidinreiche Motive umfasst, ist gelb markiert. c Vergleich konservierter Motive in verschiedenen Desaturasegruppen, dargestellt in a. d Nachweis von SCA und seinem Vorläufer in Blättern von N. benthamiana, die Arabidopsis AtSLD2 exprimieren, wobei konservierte histidinreiche Motive (Motiv2 und Motiv3) durch solche aus TgDES1 von T. grandis ersetzt wurden. AtSLD2, AtSLD2-Motif2 und AtSLD2-Motif3 sind Linien, die das Arabidopsis-Wildtyp-AtSLD2-Gen, AtSLD2 mit Motiv2 von TgDES1 bzw. AtSLD2 mit Motiv3 von TgDES1 beherbergen.

Die Charakterisierung von Proteinsequenzen ergab die Erhaltung einer N-terminalen Cytochrom-b5-ähnlichen Domäne und drei Histidin-reichen Boxen von TgDES1-Clade-Desaturasen (Clade 1) und ihren beiden eng verwandten Gruppen (Gruppe 1 und Gruppe 2 von Clade 2), was auffallend ist In den ersten beiden Histidin-reichen Kästchen wurde zwischen verschiedenen Gruppen eine Variation beobachtet (Abb. 4c). In einer früheren Studie wurde berichtet, dass die ortsspezifische Substitution von Histidin-Boxen die Spezifität und Selektivität der Substratkettenlänge beeinflussen könnte50. Die Substitution einer einzelnen Aminosäure bestimmt wahrscheinlich das Ergebnis der Entsättigungsreaktion, indem sie den Abstand zwischen den Fettacylkohlenstoffatomen des Substrats und den Metallionen des aktiven Zentrums moduliert51. Um zu testen, ob die Sequenzvariation histidinreicher Domänen die Substratspezifität bestimmt, die zum Erfolg der SCA-Biosynthese führte, ersetzten wir die histidinreiche Domäne der Arabidopsis-Desaturase AtSLD2 durch die von TgDES1 und exprimierten das Konstrukt vorübergehend in N. benthamiana-Blättern. Wir stellten fest, dass TgELO1 nicht mit dem manipulierten Desaturase-Gen koexprimiert wurde, da 20:2Δ11,14-PC, das Produkt der Δ9-Elongase-Katalyse, in Blättern des Wildtyp-Tabaks nachgewiesen werden konnte. SCA war in N. benthamiana-Blättern, die Wildtyp-AtSLD2 exprimierten, nicht nachweisbar; Der Wechsel einer der beiden Histidin-reichen Boxen von TgDES1 reichte jedoch aus, um SCA in N. benthamiana-Blättern zu synthetisieren (Abb. 4d). Zusammengenommen legen unsere Daten nahe, dass Mutationen in diesen beiden Histidin-reichen Motiven von Desaturasen zu einem Wechsel der Substratspezifität und folglich zur Entwicklung spezifischer Gruppen für die SCA-Biosynthese geführt haben, deren Verlust die signifikante Stoffwechselvielfalt zwischen Gymnospermen und Angiospermen kennzeichnet.

Die Samenentwicklung bei Gymnospermen ist ein langer Prozess, der sich über mehrere Jahre erstreckt3. Um zu verstehen, ob und wie die DNA-Methylierung an der Samenentwicklung von T. grandis beteiligt ist, wie dies bei Blütenpflanzen der Fall ist, haben wir Samenmethylome in drei Entwicklungsstadien profiliert (Abb. 5a; ergänzende Daten 9). Gene, die an der DNA-Methylierung aller drei Cytosin-Kontexte (CG, CHG, CHH) beteiligt sind, wurden im T. grandis-Genom identifiziert (Supplementary Data 3). Die weltweiten durchschnittlichen Methylierungsgrade von mCG, mCHG und mCHH im Samengenom von T. grandis betrugen 83 %, 69 % bzw. 4 %. Sowohl der mCG- als auch der mCHG-Methylierungsgrad waren höher als in den meisten zuvor untersuchten Angiospermen53, was mit der Annahme einer positiven Korrelation zwischen Genomgrößen und mCG/mCHG-Methylierungsgrad54 übereinstimmt. mC aller Sequenzkontexte war in zentromeren und perizentromeren Regionen angereichert, obwohl sowohl mCG als auch mCHG auch in den Chromosomenarmen weit verbreitet waren (Abb. 1b). In Blütenpflanzen sind Exons von Genen manchmal mit mCG angereichert, aber sowohl mit mCHG als auch mit mCHH abgereichert, was als Genkörpermethylierung (gbM)55 bezeichnet wird. Wir beobachteten die Anreicherung von mCG und die Abreicherung von mCHH in T. grandis-Genen; Es wurde jedoch auch eine Anreicherung von mCHG in transkribierten Regionen festgestellt (Abb. 5b und ergänzende Abb. 14a, b), was dem Muster bei Nadelbäumen ähnelt . Es wurde vorgeschlagen, dass GbM die Gentranskription reguliert55. Wir beobachteten eine deutliche Anreicherung von mCG anstelle von mCHG/mCHH bei mäßig exprimierten Genen, deren Expression positiv mit den Methylierungsniveaus korrelierte (Abb. 5c und ergänzende Abb. 14c), was auf eine funktionelle Erhaltung von gbM in der Schwesterlinie der Angiospermen hinweist. Es wird angenommen, dass die Entwicklung von gbM mit der Unterdrückung der DNA-Methylierung von TEs in der Nähe von Genen zusammenhängt55. Wir fanden übereinstimmend heraus, dass LTR-RTs, die den Hauptbestandteil von TEs in Genregionen darstellten, stark methyliert waren (Abb. 5d) und dass Gene mit TE-Insertionen sowohl eine höhere Expression als auch CG-Methylierung aufwiesen als solche ohne TEs (ergänzende Abb. 15).

a Geprobte Samen für die Methylom-Profilierung. Die Bilder zeigen die Außen- und Innenseite (im Längsschnitt) der Samen. b Methylierungsgrad von Exon-, Intron- und Genflankierungsregionen in Samen. c Methylierungsniveaus bei drei Cytosin-Kontexten in der exonischen Region von Genen. Gene werden anhand der geordneten Expressionsniveaus in 20 Gruppen eingeteilt. Für jede Gruppe werden der Medianwert der Genexpression und der durchschnittliche Methylierungsgrad über alle exonischen Genregionen aufgezeichnet. d Methylierungsgrad intakter LTR-RTs im T. grandis-Genom. Die GO-Begriffe sind mit Genen angereichert, die sich mit Demethylierungstälern überschneiden, die Samen aller drei Entwicklungsstadien gemeinsam haben. GO-Terme mit angepasstem P-Wert < 0,05 (zweiseitiger exakter Fisher-Test mit Benjamini-Hochberg-Korrektur) werden dargestellt und die Größen der GO-Terme in der Wortwolkenfigur korrelieren mit ihrer statistischen Signifikanz. f Ansicht der Methylierungsniveaus ausgewählter Gene, die sich mit Demethylierungstälern überlappen. CES-Cellulosesynthase, PE-Pektinesterase. g Vergleich der Methylierungsniveaus von mCG und mCHG in verschiedenen Genomregionen von Samen in drei Stadien. Quelldaten werden als Quelldatendatei bereitgestellt.

Gene für die Samenentwicklung und -keimung sind häufig in Demethylierungstälern (DMVs) lokalisiert, wo der Methylierungsgrad für einen der Cytosin-Kontexte niedrig war (z. B. <5 %). Wir identifizierten 5099 häufige DMVs im Samengenom der drei Proben, die 30 MB umfassten, einschließlich des größten Intervalls, das sich auf 144 kb erstreckte. Die DMVs überschnitten sich mit 4200 proteinkodierenden Genen, von denen viele wichtige Klassen von Samenproteinen kodierten, wie etwa Speicherproteine, Transkriptionsfaktoren und Enzyme zur Zellwandmodifikation, Hormonhomöostase und Fettsäurebiosynthese (Abb. 5e, f). Der Samen von T. grandis ist mit einem speziellen Auswuchs umhüllt, der als Aril bezeichnet wird (Abb. 5a). Während der Entwicklung entwickelt die Samenschale stark verholzte sekundäre Zellwände, um die äußere Oberfläche des Samens zu verstärken58, während eine weiche innere Oberfläche erhalten bleibt, die das Endosperm direkt umgibt. Konsequenterweise wurden in DMVs häufig Gene gefunden, die für Laccasen (n = 38) kodieren, die an der Zellwandverholzung beteiligt sind59, und für Expansine (n = 13), die mit der Zellwandlockerung assoziiert sind60 (Abb. 5f). Bemerkenswerterweise befanden sich 18 % der Gene des T. grandis-Transkriptionsfaktors (TF) (n = 370) in Samen-DMV-Regionen, was eine signifikante Anreicherung darstellt (χ2-Test; P <0,0001; Ergänzende Daten 10). Diese TFs gehörten zu verschiedenen Genfamilien, kamen jedoch besonders häufig in den Familien MYB, NAC und AP2 vor, von denen bekannt ist, dass sie das Wachstum und die Entwicklung von Pflanzen regulieren. Die Methylierung von mCHH variierte während der Samenentwicklung deutlicher als die von mCG und mCHG (Abb. 5g und ergänzende Abb. 16). Wir haben für jeden der drei Cytosin-Kontexte differentiell methylierte Regionen (DMRs) identifiziert (Supplementary Data 11–13). Von den Genen, die mit DMRs überlappten, wurden 12 % unterschiedlich exprimiert, was auf die Übersetzung der epigenetischen Variation in die Genexpressionsflexibilität während der Samenentwicklung hindeutet (ergänzende Abbildung 17). Die GO-Anreicherungsanalyse zeigte, dass DMR-assoziierte Gene hauptsächlich mit denen angereichert waren, die an der Photosynthese und dem Sekundärstoffwechsel beteiligt sind (Supplementary Data 14), was mit der Tatsache übereinstimmt, dass die Photosynthese energieerzeugende biochemische Wege antreibt, indem sie während der Entwicklung von Grün Sauerstoff zum Samengewebe liefert Samen, da sich entwickelnde Samen unter einer begrenzten Sauerstoffdurchdringung leiden, insbesondere in das innere Gewebe61.

Gymnospermen gelten als Schatzkammer der Lebensgeschichte auf der Erde. Hier haben wir ein Referenzgenom auf Chromosomenebene für die Gymnospermenart T. grandis zusammengestellt. Die Genomgröße ist riesig und viel größer als die der meisten jemals sequenzierten Pflanzenarten. Basierend auf dieser Zusammenstellung und Analyse von Multi-Omics-Daten kommen wir zu dem Schluss, dass (1) die Akkumulation alter LTR-RTs zur Aufblähung des T. grandis-Genoms beiträgt, wohingegen T. grandis der TE-Expansion durch ungleiche Rekombination und epigenetische Stummschaltung mit a entgegenwirkt Mechanismus möglicherweise anders als bei Angiospermen; (2) Der Gewinn oder Verlust wichtiger Genfamilien in T. grandis, z. B. derjenigen, die an Zellwandaktivitäten und der Paclitaxel-Biosynthese beteiligt sind, liegt seiner phänotypischen Diversität zugrunde, und MADS-Box-Gene, die mit der Identität von Fortpflanzungsorganen assoziiert sind, umfassen nicht nur klassische B- und C -Funktionsgene, die bereits in früheren Studien35,36,37,38,39 vorgeschlagen wurden, aber auch zusätzliche Gene (z. B. TG8g01565), die ein anderes Expressionsmuster als B- und C-Funktionsgene aufweisen; (3) die Δ9-Elongase und die Δ5-Desaturase sind in der Lage, SCA zu synthetisieren, und diese beiden Enzyme haben sich gemeinsam entwickelt und sind in Blütenpflanzen verloren gegangen; Darüber hinaus wird die Substratspezifität der Δ5-Desaturase durch die beiden histidinreichen Boxen bestimmt, deren Mutation zu einer Abwechslung in der Substraterkennung und anschließend zu einer Veränderung ihres Produkts führen kann; (4) Das Samengenom von T. grandis umfasst sowohl stark methylierte Wiederholungssequenzen als auch Demethylierungstäler, wobei sich letztere mit Genen überschneiden, die wichtige Samenfunktionen wie Zellwandmodifikation und Fettsäurebiosynthese sowie die Regulierung der Genexpression und Hormonhomöostase ausüben . Insgesamt liefern unser hochwertiges Referenzgenom in Verbindung mit vergleichenden und funktionellen Genomanalysen Einblicke in die Biologie der Gymnospermen, insbesondere in die Biosynthese und Evolution von SCA, die sich durch metabolische Vielseitigkeit zwischen den wichtigsten Landpflanzenlinien auszeichnen.

Junge Blätter einer in Shaoxing, China, angebauten Pflanze von T. grandis wurden im März 2018 gesammelt und für die DNA-Extraktion nach der CTAB-Methode (2 %) verwendet62. Eine Paired-End-Bibliothek (PE) mit einer Insertionsgröße von 350 bp wurde mit dem Illumina Genomic DNA Sample Preparation Kit gemäß den Anweisungen des Herstellers (Illumina) erstellt und auf einem Illumina NovaSeq-System mit einer Leselänge von 150 bp sequenziert. Eine PacBio SMRTbell-Bibliothek wurde mit dem SMRTbell Express Template Prep Kit 2.0 erstellt und auf einer PacBio Sequel II-Plattform sequenziert. Die zirkulären Konsens-Lesevorgänge (HiFi-Lesevorgänge) wurden mit der CCS-Software (https://github.com/pacificbiosciences/unanimity/) mit dem Parameter „-minPasses 3“ generiert. Die Vorbereitung und Sequenzierung der Hi-C-Bibliothek wurde von Novogene (Tianjin, China) gemäß einem an anderer Stelle beschriebenen Protokoll durchgeführt63. Kurz gesagt wurden Bibliotheken unter Verwendung von in 2 % Formaldehyd fixierten Blattgeweben hergestellt. Die Kerne wurden extrahiert und permeabilisiert, und das Chromatin wurde mit dem Restriktionsenzym DpnII (NEB) verdaut. Das verdaute Chromatin wurde mit glatten Enden versehen und mit Biotin markiert. Die DNA-Ligation wurde unter Verwendung von T4-DNA-Ligase (NEB) durchgeführt, wonach Proteinase K zur umgekehrten Vernetzung hinzugefügt wurde. Anschließend wurden die DNA-Fragmente auf einer Illumina NovaSeq-Plattform mit einer Leselänge von 2 × 150 bp gereinigt und sequenziert.

Um die Genvorhersage zu unterstützen, wurde eine Transkriptomsequenzierung für Proben durchgeführt, die aus Blatt-, Wurzel-, Stängel-, jungen Samen-, Arillus-, Samenschalen- und Kerngeweben derselben Pflanze entnommen wurden (Ergänzungsdaten 1). Die Gesamt-RNA wurde mit TRIzol-Reagenz (Invitrogen) extrahiert und mit dem NanoDrop ND-2000-Spektrophotometer (NanoDrop Technologies) quantifiziert. Aus Gesamt-RNA gereinigte mRNA mit einem RIN-Score ≥8 (Bioanalyzer 2100, Agilent Technologies) wurde für den Bibliotheksaufbau mit dem NEBNext Ultra II RNA Library Prep Kit für Illumina (NEB) gemäß den Anweisungen des Herstellers verwendet. Die nichtsträngigen RNA-Seq-Bibliotheken wurden auf einer Illumina NovaSeq-Plattform im 2 × 150-bp-Modus sequenziert. Für PacBio Iso-seq wurde die Gesamt-RNA aus Blatt-, Wurzel-, Stamm-, Aril- und Kerngeweben zu gleichen Teilen gepoolt und cDNA mit dem SMARTer PCR cDNA Synthesis Kit (Clontech) synthetisiert. Die Größenfraktionierung und -selektion (1–2, 2–3 und 3–6 kb) wurde mit dem BluePippin Size Selection System (Sage Science) durchgeführt. Die SMRT-Bibliotheken wurden mit dem SMRTbell Template Prep Kit 1.0 (Pacific Biosciences) generiert und auf der PacBio RSII-Plattform sequenziert.

Die HiFi-Lesevorgänge wurden mit hifiasm64 (Version 0.8-dirty-r280) mit Standardparametern zusammengestellt und die zusammengestellten Contigs wurden von Racon (https://github.com/lbcb-sci/racon; v1.4.13) mit Illumina-Lesevorgängen weiter verfeinert. Purge Haplotigs65 (Version v1.1.0) wurde verwendet, um redundante Sequenzen in der Assembly mit den Parametern „-l 15 -m 70 -h 125“ für den Unterbefehl „contigcov“ und „-a 55“ für den Unterbefehl „purge“ herauszufiltern. Illumina-Lesevorgänge aus Hi-C-Bibliotheken wurden mit Trimmomatic66 (v0.36) verarbeitet, um Adapter und Sequenzen mit geringer Qualität zu entfernen. Die bereinigten Lesevorgänge wurden von HiCUP (https://www.bioinformatics.babraham.ac.uk/projects/hicup/) analysiert, um nicht duplizierte gültige Alignments zu identifizieren, die dann für das Gerüst mit ALLHiC67 (Version 0.9.8) verwendet wurden. Das anfängliche Gerüst wurde manuell mit Juicebox (https://github.com/aidenlab/Juicebox) kuratiert. Die Vollständigkeit der Assemblierung wurde mithilfe der Illumina-Sequenzierungsablesungen bewertet, die mithilfe von BWA-MEM68 auf die Genomassemblierung abgebildet wurden.

Repetitive Sequenzen wurden mithilfe einer Kombination aus homologiebasierten und De-novo-Vorhersagen identifiziert. Es wurde eine artspezifische TE-Bibliothek für T. grandis erstellt, die LTR-Retrotransposons (LTR-RTs) und andere durch LTR_Finder69 bzw. RepeatModeler70 identifizierte TE-Elemente umfasst. Diese Bibliothek wurde dann mit der Repbase-Bibliothek71 zur TE-Identifizierung durch RepeatMasker72 (v.4.0.7) kombiniert. Repetitive Elemente wurden auch von RepeatProteinMask vorhergesagt und die repetitiven Tandemsequenzen wurden vom TRF-Programm73 identifiziert. Um die Einfügungszeiten von LTR-RT abzuschätzen, wurden intakte LTR-RTs mit LTR_Finder und LTR-harvest74 durchsucht. MUSCLE75 wurde verwendet, um LTR-Sequenzen intakter LTR-RTs auszurichten, und der Nukleotidabstand (K) zwischen ihnen wurde mit dem Kimura-Zwei-Parameter-Kriterium unter Verwendung des distmat-Programms im EMBOSS-Paket (http://emboss.sourceforge.net) berechnet. . Die Einfügungszeit (T) wurde berechnet als

wobei die für Gymnospermenarten verwendete Nukleotidsubstitutionsrate (r) 2,2 × 10−9 pro Base und Jahr betrug11. Die mutmaßlichen zentromeren Wiederholungen wurden basierend auf der Kopienzahl und der chromosomalen Verteilung der durch TRF identifizierten Tandem-Wiederholungen bestimmt.

Proteinkodierende Gene wurden mithilfe wiederholt maskierter Genomsequenzen vorhergesagt. Für eine homologiebasierte Vorhersage wurden Proteinsequenzen aus einem Moos (Physcomitrella patens), einem Farn (Selaginella moellendorffii), sieben Angiospermen (Amborella trichopoda, Arabidopsis thaliana, Oryza sativa, Phalaenopsis equestris, Populus trichocarpa, Vitis vinifera und Zea mays) und vier verwendet Gymnospermen (Ginkgo biloba, Gnetum montanum, Picea abies und Pinus taeda) wurden mithilfe von TBLASTN76 mit einem E-Wert-Cutoff von 1E−5 auf das Genom von T. grandis ausgerichtet. GenBlastA77 wurde dann angewendet, um benachbarte Paare mit hoher Punktzahl aus denselben Proteinausrichtungen zu gruppieren, und die entsprechenden Genstrukturen wurden mit GeneWise78 (v.2.4.1) identifiziert. Rohe RNA-Seq-Reads wurden mit Trimmomatic66 (v0.36) bereinigt und mit TopHat279 auf das T. grandis-Genom abgebildet. Anschließend wurde Cufflinks80 (v.2.2.1) zur Vorhersage von Genmodellen eingesetzt. Die bereinigten RNA-Seq-Reads wurden auch zur Vorhersage von Genstrukturen mit Trinity81 (v2.0.13) und PASA82 (v2.2.0) verwendet. Alle von der PASA-Pipeline vorhergesagten vollständigen Genstrukturen wurden für das Genmodelltraining für AUGUSTUS83, GlimmerHMM84 und SNAP85 verwendet. Diese drei Prädiktoren sowie geneid86 und GENSCAN87 wurden für die Ab-initio-Genvorhersage mit Standardparametern verwendet, mit der Ausnahme, dass „-noInFrameStop=true -genemodel=complete“ auf AUGUSTUS angewendet wurde. Schließlich wurden alle mit unterschiedlichen Ansätzen vorhergesagten Genmodelle integriert, um mithilfe von EVidenceModeler88 einen hochsicheren Gensatz mit der folgenden Gewichtungsbewertungsmatrix zu generieren: PASA, 100; GeneWise, 20; Manschettenknöpfe, 20; 5. AUGUSTUS; andere Ab-initio-Prädiktoren, 1.

Um die Genauigkeit der vorhergesagten Gene zu bewerten, haben wir die Abdeckung hochkonservierter Gene mithilfe von BUSCO19 untersucht. Wir führten außerdem eine funktionale Annotation der von T. grandis vorhergesagten Genmodelle durch, indem wir mit den Datenbanken Kyoto Encyclopedia of Genes and Genomes (KEGG; https://www.genome.jp/kegg/)89, SwissProt und TrEMBL (https:// www.uniprot.org/) unter Verwendung von BLASTP mit einem E-Wert-Grenzwert von 1E-5, und die besten Alignment-Treffer wurden verwendet, um homologiebasierte Genfunktionen zuzuweisen. GO-Kategorien (http://geneontology.org/) und InterPro-Einträge (https://www.ebi.ac.uk/interpro/) wurden über InterProScan90 abgerufen.

Das längste Transkript jedes der proteinkodierenden Gene von 18 repräsentativen Arten (Taxus wallichiana, Amborella trichopoda, Arabidopsis thaliana, Ginkgo biloba, Gnetum montanum, Welwitschia mirabilis, Oryza sativa, Solanum lycopersicum, Physcomitrella patens, Pinus tabuliformis, Selaginella moellendorffii, Vitis vinifera, Sequoiadendron giganteum, Azolla filiculoides, Klebsormidium flaccidum, Chara braunii, Marchantia polymorpha und Penium margaritaceum) und T. grandis wurden ausgewählt, um Genfamilien basierend auf All-gegen-alle-BLASTP-Alignments mit OrthoFinder91 zu konstruieren. Phylogenetische Analysen wurden mit IQ-TREE92 (Version 2.1.3) durchgeführt. Basierend auf der MRCA-Analyse mit CAFE93 (v.4.2.1) haben wir die Expansion und Kontraktion von Genfamilien zwischen vorhandenen Arten und ihren letzten gemeinsamen Vorfahren bestimmt.

Die Alle-gegen-Alle-BLASTP-Suche wurde mit einem E-Wert-Grenzwert von 1E-5 durchgeführt. Die fünf besten Alignments wurden für jedes Gen ausgewählt und zum Nachweis syntenischer Genpaare in kollinearen Blöcken mit MCScanX94 verwendet. Paraloge Genpaare wurden durch die besten reziproken BLASTP-Alignments bestimmt. Ks jedes syntenischen oder paralogen Genpaars wurde unter Verwendung von YN00 im Paket PAML 4.8a95 mit Standardparametern berechnet. Die auf Phylogenie basierende Schlussfolgerung der WGD wurde basierend auf dem Abgleich jedes Genbaums und des Artenbaums durchgeführt.

Die Gesamt-RNA (3 μg) aus Blättern wurde für den Aufbau einer kleinen RNA-Bibliothek unter Verwendung des NEB Next® Multiplex Small RNA Library Prep Set für Illumina® (NEB, USA) gemäß den Empfehlungen des Herstellers isoliert. DNA-Fragmente in der konstruierten Bibliothek im Bereich von 140–160 bp wurden gewonnen und die Bibliothek auf einem Agilent Bioanalyzer 2100-System bewertet und anschließend auf einer Illumina HiSeq 2500-Plattform sequenziert. Rohdaten einer kleinen RNA-Bibliothek wurden mit Trimmomatic66 (v0.36) verarbeitet, um Adapter zu entfernen, und dann mit Bowtie96 am Referenzgenom ausgerichtet, ohne dass eine Fehlpaarung zulässig war.

T. grandis-Samen wurden am 8. März (Stadium 1), 24. März (Stadium 2) und 8. April (Stadium 3) des Jahres 2021 von einem einzelnen Baum zur Bisulfit- und Transkriptomsequenzierung gesammelt. Etwa 100 ng hochwertige genomische DNA, versetzt mit 0,5 ng Lambda-DNA, wurden mit Covaris S220 beschallt (Parameter: PIP, 50 W; Leistungsfaktor, 20; Zyklen pro Burst, 200; Behandlungszeit, 110 s; Temperatur, 20 °C; Probenvolumen, 52 μL). Die fragmentierte DNA (200–300 bp) wurde mit Bisulfit unter Verwendung des EZ DNA Methylation-GoldTM Kit (Zymo Research) behandelt und die Qualität der Bibliothek auf der Illumina NovaSeq-Plattform im Paired-End-Modus bewertet und sequenziert.

Rohe Lesevorgänge wurden mit Trimmomatic66 (v0.36) bereinigt, um Adapter und Sequenzen mit geringer Qualität zu entfernen. Um die bereinigten Reads auszurichten, wurden sowohl das Referenzgenom als auch die Reads transformiert (C-zu-T und G-zu-A) und dann mit Bismark97 (Version 0.16.3) mit den Parametern „-X 700 –dovetail“ abgeglichen. Lesevorgänge, die ein einzigartiges bestes Alignment sowohl gegenüber den „Watson“- als auch „Crick“-Strängen des Genoms ergaben, wurden beibehalten und der Methylierungszustand aller Cytosinnukleotide abgeleitet. Die Natriumbisulfit-Umwandlungsrate wurde basierend auf den Read-Alignments zum Lambda-Genom geschätzt. Methylierte Stellen wurden mit einem Binomialtest unter Verwendung der Methylierungszahlen (mC), der Gesamtzahlen (mC+umC) und der Konversionsrate (r) identifiziert. Standorte mit einem FDR-korrigierten P-Wert <0,05 wurden als methylierte Standorte betrachtet. Um den Methylierungsgrad des gesamten Genoms zu berechnen, haben wir das Genom in 10-kb-Bins unterteilt und der Methylierungsgrad jedes Fensters als Anzahl (mC)/(Anzahl (mC) + Anzahl (umC)) berechnet. Differenziell methylierte Regionen (DMRs) wurden mit der DSS-Software98 unter dem P-Wert-Schwellenwert von 0,05 identifiziert. DMRs wurden danach katalogisiert, ob und wie sie sich mit Genen überlappten. Kontinuierliche Cytosinstellen im T. grandis-Genom mit einem Methylierungsgrad von <5 % in jedem Kontext wurden zusammengeführt und als Demethylierungstäler definiert.

Männliche Zapfen wurden vom T. grandis-Baum in acht verschiedenen Stadien im Februar und April 2021 mit einem Zeitintervall von 7 Tagen gesammelt, und weibliche Zapfen wurden in sechs verschiedenen Stadien im Januar und April 2021 mit einem Zeitintervall von 16 Tagen gesammelt . Andere Proben, einschließlich Kern, Blatt, Wurzel und Stamm, wurden vom selben Baum gesammelt. Jede Probenahme wurde mit drei biologischen Replikaten durchgeführt. Die Gesamt-RNA wurde mit TRIzol-Reagenz (Invitrogen) extrahiert. RNA-Seq-Bibliotheken wurden mit dem NEBNext Ultra II RNA Library Prep Kit für Illumina (NEB) gemäß den Anweisungen des Herstellers erstellt und auf einer Illumina NovaSeq-Plattform im 2 × 150-bp-Modus sequenziert. Rohe RNA-Seq-Reads wurden mit Trimmomatic66 (v0.36) bereinigt. Die bereinigten Lesevorgänge wurden mit STAR aligner99 (v2.7.10a) dem Genom zugeordnet. Die Alignments wurden unter Verwendung von HTSeq-count100 gezählt und differenziell exprimierte Gene wurden mit DESeq2 (Ref. 101) unter dem Cutoff von angepasstem P ≤ 0,01 und Fold Change ≥2 identifiziert.

Potenzielle HGTs wurden anhand von Homologiewerten und Phylogeniesignalen identifiziert102. Kurz gesagt, wir haben drei maßgeschneiderte Datenbanken erstellt, nämlich eine Datenbank außerhalb der Gruppe, die alle Proteinsequenzen von Archaeen, Bakterien und Pilzen umfasst, eine Datenbank innerhalb der Gruppe, die Proteinsequenzen von 10 veröffentlichten Gymnospermenarten enthält, und eine Datenbank der Mittelgruppe, die Sequenzen von allen enthält veröffentlichte Pflanzen, ausgenommen Gymnospermen. Proteinsequenzen von T. grandis wurden getrennt mit den drei angepassten Datenbanken mit einem E-Wert-Grenzwert von 1E-5 abgeglichen. Für jede abgefragte Proteinsequenz haben wir nicht mehr als 100 Blast-Hits (ein Hit pro Art) für jede Datenbank gespeichert und den durchschnittlichen Bit-Score-Wert (ABV) der Alignments berechnet. Abfrageproteine, deren Alkoholgehalt in der Außengruppe größer war als in der Mittelgruppe, wurden beibehalten. Wir haben für jedes der verbleibenden Abfrageproteine ​​strenge phylogenetische Analysen durchgeführt und die Topologie des Baums manuell überprüft. T. grandis-Gene, die sowohl durch ABV als auch durch Phylogenie unterstützt werden, wurden als potenzielle horizontal übertragene Gene angesehen.

Etwa 0,5 g getrocknete Proben wurden 10 Stunden lang bei Raumtemperatur mit 9 ml 10 %iger H2SO4-CH3OH-Lösung gemischt. Die Fettsäuremethylester wurden filtriert und dann mit 30 ml destilliertem Wasser und 30 ml Dichlormethan extrahiert. Die organische Phase wurde mit wasserfreiem Natriumsulfat getrocknet und mit einem Stickstoffgebläse auf etwa 1 ml konzentriert. Der konzentrierte Extrakt wurde für die Fettsäureanalyse mittels Gaschromatographie (GC; Thermo Scientific TRACE-1300, Italien) verwendet, wobei die Methylfettsäure als interner Standard verwendet wurde. Die GC-Trennung wurde unter Verwendung einer Agilent DB-WAX-Kapillar-GC-Säule (30 m × 0,25 mm und 0,25 μm Filmdicke) durchgeführt, und 1 μl jeder Probe wurde im Split-Modus mit einem Verhältnis von 1:20 injiziert. Als Trägergas wurde hochreines Helium verwendet. Die Temperaturen der Injektionsöffnung und des Detektors wurden auf 220 °C bzw. 240 °C eingestellt. Die Säulentemperaturprogrammierung begann bei 140 °C, wurde 1 Minute lang gehalten und mit einer Geschwindigkeit von 4 °C/Minute auf 250 °C erhitzt. Die Säulentemperatur wurde 2 Minuten lang bei 250 °C gehalten.

Das CDS jedes Gens ohne Stoppcodon wurde kloniert und an den N-Terminus des GFP-Gens des pCAMBIA1300-GFP-Vektors fusioniert. Das resultierende Plasmid wurde in Agrobacterium tumefaciens GV3101 eingeführt. Positive Klone wurden bis zu einer OD600 von 0,6 inkubiert und dann 6 Minuten lang bei 8000 U/min zentrifugiert. Die gesammelten Zellen wurden mit Infiltrationspuffer (10 mM MgCl2, 0,2 mM Acetosyringon und 10 mM MES bei pH 5,6) resuspendiert, der dann in die Blätter von Nicotiana benthamiana injiziert wurde. Nach 3 Tagen Kultur wurde das GFP-Fluoreszenzsignal von den Blättern beobachtet und mithilfe konfokaler Laser-Scanning-Mikroskopie (LSM510: Karl Zeiss) erfasst.

Die Gesamt-RNA wurde mit dem RNAprep pure Plant Kit (TIANGEN) extrahiert. Erststrang-cDNA wurde aus 1 μg Gesamt-RNA mit dem PrimeScriptTM RT Master Mix Kit (Takara) synthetisiert. Das SYBR Premix Ex Taq™ Kit (Takara) wurde zur Durchführung einer quantitativen Echtzeit-PCR verwendet. Die Expressionsdaten der Zielgene wurden mit der Expression des für Aktin kodierenden Gens korrigiert. Die Reaktionsbedingungen waren 95 °C für 10 s, 55 °C für 10 s, 72 °C für 20 s, 45 Zyklen. Der relative Ausdruck wurde mit der 2-ΔΔCt-Methode berechnet.

Kodierende Regionen von TgEOL1, TgDES1, AtSLD2 (AT2G46210) und zwei rekombinanten Genen (AtSLD2-Motif2 und AtSLD2-Motif3) wurden jeweils stromabwärts des 35S-Promotors des binären Vektors (pCAMBIA1300) eingefügt. Jedes der resultierenden Konstrukte wurde in den Agrobactrium tumefaciens-Stamm GV3101 transformiert, der dann bei 28 °C in LB-Medium, ergänzt mit Kanamycin (50 mg/L) und Rifampicillin (50 mg/L), gezüchtet wurde, bis die OD600 0,6 erreichte. Zur vorübergehenden Expression von AtSLD2 und zwei rekombinanten Genen in N. benthamiana-Blättern wurden Zellen geerntet und in 10 mM MES-Puffer (enthaltend 10 mM MgCl2 und 0,1 mM Acetosyringon) bis zu einer endgültigen OD600 von 1,0 resuspendiert. Die Zellen jedes Stammes wurden mit einer nadellosen Spritze in die jungen Blätter fünf Wochen alter N. benthamiana-Pflanzen infiltriert, die fünf Tage später zur Messung des SCA-Gehalts geerntet wurden. Zur Erzeugung von TgDES1- und TgELO1-überexprimiertem Arabidopsis wurden die Konstrukte pCAMBIA1300-TgELO1 und pCAMBIA1300-TgELO1 über die A. tumefaciens-vermittelte Blumentauchmethode in Arabidopsis transformiert. Für die Samenernte wurden Hygromycin-resistente T1-Pflanzen gepflanzt und T2-Samen mit einem Hygromycin-Resistenzverhältnis von 3:1 wurden zur Gewinnung von T3-Samen ausgewählt. Zur Bestimmung des SCA-Gehalts wurden T3-Samen mit 100 % Resistenz gegenüber Hygromycin verwendet.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.

Genomassemblierung und Rohdaten für die Genom-, Transkriptom- und Methylomsequenzierung wurden in der BioProject-Datenbank des National Center for Biotechnology Information unter der Zugangsnummer PRJNA938254 und im CNGB Sequence Archive (CNSA) der China National GeneBank DataBase (CNGBdb) unter der Zugangsnummer CNP0003453 hinterlegt. Genomassemblierung und Annotation sind auch bei Figshare verfügbar [https://doi.org/10.6084/m9.figshare.21089869]. Quelldaten werden mit diesem Dokument bereitgestellt.

Li, HT et al. Ursprung der Angiospermen und das Rätsel der Jura-Lücke. Nat. Pflanzen 5, 461–470 (2019).

Artikel PubMed Google Scholar

De La Torre, AR et al. Funktionelle und morphologische Entwicklung bei Gymnospermen: Ein Porträt beteiligter Genfamilien. Entwicklung Appl 13, 210–227 (2020).

Artikel PubMed Google Scholar

Linkies, A., Graeber, K., Knight, C. & Leubner-Metzger, G. Die Evolution der Samen. N. Phytol. 186, 817–831 (2010).

Artikel CAS Google Scholar

Chen, X. & Jin, H. Überblick über den Anbau und die Entwicklung der chinesischen Torreya in China. Trees Livelihoods 28, 68–78 (2019).

Artikel Google Scholar

Wang, H., Guo, T. & Ying, GQ Fortschritte in Studien zu aktiven Bestandteilen und ihren pharmakologischen Aktivitäten für Pflanzen von Torreya Arn. Kinn. Tradition. Kraut. Drogen 38, 1748–1750 (2007).

Google Scholar

Wu, J. et al. Die De-novo-Transkriptomsequenzierung von Torreya grandis zeigt die Genregulation im Sciadodonsäure-Biosyntheseweg. Ind. Nutzpflanzen Prod. 120, 47–60 (2018).

Artikel CAS Google Scholar

He, Z. et al. Chemische Bestandteile kaltgepresster Kernöle verschiedener Torreya grandis-Sorten. Lebensmittelchem. 209, 196–202 (2016).

Artikel CAS PubMed Google Scholar

Berger, A. et al. Epidermale entzündungshemmende Eigenschaften von 5,11,14 20:3: Auswirkungen auf Mausohrödeme, PGE2-Spiegel in kultivierten Keratinozyten und PPAR-Aktivierung. Lipide Health Dis. 1, 5 (2002).

Artikel PubMed PubMed Central Google Scholar

Pédrono, F. et al. Aus Pinienkernen gewonnene Sciadonsäure als Nahrungsbestandteil zur Reduzierung von Plasmatriglyceriden durch Hemmung der hepatischen Δ9-Desaturase der Ratte. Wissenschaft. Rep. 10, 6223 (2020).

Artikel ADS PubMed PubMed Central Google Scholar

Endo, Y., Osada, Y., Kimura, F. & Fujimoto, K. Auswirkungen von japanischem Torreya-Samenöl (Torreya nucifera) auf den Lipidstoffwechsel bei Ratten. Ernährung 22, 553–558 (2006).

Artikel CAS PubMed Google Scholar

Song, L. et al. Fortschritte bei Delta-5-ungesättigten Polymethylen-unterbrochenen Fettsäuren: Ressourcen, Biosynthese und Vorteile. Krit. Rev. Food Sci. Nutr. 63, 767–789 (2023).

Aitzetmüller, K. Ein ungewöhnliches Fettsäuremuster im Eranthis-Samenöl. Lipids 31, 201–205 (1996).

Artikel PubMed Google Scholar

Niu, S. et al. Das Genom und Methylom der chinesischen Kiefer enthüllen wichtige Merkmale der Nadelbaumentwicklung. Zelle 185, 204–217.e14 (2022).

Artikel CAS PubMed Google Scholar

Nystedt, B. et al. Die Genomsequenz der Gemeinen Fichte und die Evolution des Nadelbaumgenoms. Natur 497, 579–584 (2013).

Artikel ADS CAS PubMed Google Scholar

Liu, H. et al. Das nahezu vollständige Genom von Ginkgo biloba beleuchtet die Evolution der Gymnospermen. Nat. Pflanzen 7, 748–756 (2021).

Artikel CAS PubMed Google Scholar

Wan, T. et al. Das Welwitschia-Genom offenbart eine einzigartige Biologie, die der extremen Langlebigkeit in Wüsten zugrunde liegt. Nat. Komm. 12, 4247 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Liu, Y. et al. Das Cycas-Genom und die frühe Evolution von Samenpflanzen. Nat. Pflanzen 8, 389–401 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Cheng, J. et al. Das Genom der Himalaya-Eibe auf Chromosomenebene bietet Einblicke in den Ursprung und die Entwicklung des Paclitaxel-Biosynthesewegs. Mol. Werk 14, 1199–1209 (2021).

Artikel CAS PubMed Google Scholar

Xiong, X. et al. Das Taxus-Genom bietet Einblicke in die Paclitaxel-Biosynthese. Nat. Pflanzen 7, 1026–1036 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Rhie, A., Walenz, BP, Koren, S. & Phillippy, AM Merqury: Referenzfreie Qualitäts-, Vollständigkeits- und Phasenbewertung für Genomassemblierungen. Genombiol. 21, 245 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Manni, M., Berkeley, MR, Seppey, M., Simão, FA & Zdobnov, EM BUSCO-Update: neuartige und optimierte Arbeitsabläufe zusammen mit einer breiteren und tieferen phylogenetischen Abdeckung für die Bewertung eukaryotischer, prokaryotischer und viraler Genome. Mol. Biol. Entwicklung 38, 4647–4654 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Ou, S., Chen, J. & Jiang, N. Bewertung der Qualität der Genomassemblierung mithilfe des LTR-Assembly-Index (LAI). Nucleic Acids Res 46, e126 (2018).

PubMed PubMed Central Google Scholar

Steinthorsdottir, M. et al. Das Miozän: die Zukunft der Vergangenheit. Paläozeangr. Paläoklimatol. 36, e2020PA004037 (2021).

Artikel Google Scholar

El Baidouri, M. & Panaud, O. Die vergleichende genomische Paläontologie im gesamten Pflanzenreich enthüllt die Dynamik der TE-gesteuerten Genomentwicklung. Genombiol. Entwicklung 5, 954–965 (2013).

Artikel PubMed PubMed Central Google Scholar

Matzke, MA & Mosher, RA RNA-gesteuerte DNA-Methylierung: ein epigenetischer Weg mit zunehmender Komplexität. Nat. Rev. Genet. 15, 394–408 (2014).

Artikel CAS PubMed Google Scholar

Nakamura, M., Köhler, C. & Hennig, L. Gewebespezifische Transposon-assoziierte kleine RNAs im Gymnospermbaum, Gemeine Fichte. BMC-Genom. 20, 997 (2019).

Artikel CAS Google Scholar

Van de Peer, Y., Mizrachi, E. & Marchal, K. Die evolutionäre Bedeutung der Polyploidie. Nat. Rev. Genet. 18, 411–424 (2017).

Artikel PubMed Google Scholar

Leebens-Mack, JH et al. Eintausend Pflanzentranskriptome und die Phylogenomik grüner Pflanzen. Natur 574, 679–685 (2019).

Artikel Google Scholar

Sun, X. et al. Genom und Evolution des arbuskulären Mykorrhizapilzes Diversispora epigaea (früher Glomus versiforme) und seiner bakteriellen Endosymbionten. N. Phytol. 221, 1556–1573 (2019).

Artikel CAS Google Scholar

Jiao, C. et al. Das Genom von Penium margaritaceum: Kennzeichen der Herkunft von Landpflanzen. Zelle 181, 1097–1111.e12 (2020).

Artikel CAS PubMed Google Scholar

Bowman, JL et al. Einblicke in die Evolution von Landpflanzen aus dem Genom von Marchantia polymorpha. Zelle 171, 287–304.e15 (2017).

Artikel CAS PubMed Google Scholar

Bouché, F., Lobet, G., Tocquin, P. & Périlleux, C. FLOR-ID: eine interaktive Datenbank von Gennetzwerken zur Blütezeit in Arabidopsis thaliana. Nukleinsäuren Res. 44, D1167–D1171 (2016).

Artikel PubMed Google Scholar

Li, LX et al. Arabidopsis thaliana NOP10 ist für die Gametophytenbildung erforderlich. J. Integr. Pflanzenbiol. 60, 723–736 (2018).

Artikel CAS PubMed Google Scholar

Schoof, H. et al. Die Stammzellpopulation der Sprossmeristeme von Arabidopsis wird durch eine Regelschleife zwischen den Genen CLAVATA und WUSCHEL aufrechterhalten. Zelle 100, 635–644 (2000).

Artikel CAS PubMed Google Scholar

Soltis, DE, Chanderbali, AS, Kim, S., Buzgo, M. & Soltis, PS Das ABC-Modell und seine Anwendbarkeit auf basale Angiospermen. Ann. Bot. 100, 155–163 (2007).

Artikel CAS PubMed PubMed Central Google Scholar

Dreni, L. & Zhang, D. Blütenentwicklung: die Evolutionsgeschichte und Funktionen der MADS-Box-Gene der AGL6-Unterfamilie. J. Exp. Bot. 67, 1625–1638 (2016).

Artikel CAS PubMed Google Scholar

Kong, X. et al. Das Weizen-AGL6-ähnliche MADS-Box-Gen ist ein Hauptregulator für die Identität der Blütenorgane und ein Ziel für die Manipulation der Entwicklung des Ährchenmeristems. Pflanzenbiotechnologie. J. 20, 75–88 (2022).

Artikel CAS PubMed Google Scholar

Zhang, L. et al. Das Seerosengenom und die frühe Evolution blühender Pflanzen. Natur 577, 79–84 (2020).

Artikel ADS CAS PubMed Google Scholar

Chanderbali, AS et al. Die Erhaltung und Kanalisierung der Genexpression während der Diversifizierung der Angiospermen begleitet den Ursprung und die Entwicklung der Blüte. Proz. Natl Acad. Wissenschaft. USA 107, 22570–22575 (2010).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Souza, PFN Die vergessenen 2S-Albuminproteine: Bedeutung, Struktur und biotechnologische Anwendung in der Landwirtschaft und der menschlichen Gesundheit. Int. J. Biol. Makromol. 164, 4638–4649 (2020).

Artikel CAS PubMed Google Scholar

Tandang-Silvas, MR et al. Konservierung und Divergenz von 11S-Globulinen von Pflanzensamen basierend auf Kristallstrukturen. Biochim. Biophys. Acta 1804, 1432–1442 (2010).

Artikel CAS PubMed Google Scholar

Cheng, S. et al. Genome subaerialer Zygnematophyceen liefern Einblicke in die Evolution von Landpflanzen. Zelle 179, 1057–1067.e14 (2019).

Artikel CAS PubMed Google Scholar

Weng, JK & Chapple, C. Der Ursprung und die Entwicklung der Ligninbiosynthese. N. Phytol. 187, 273–285 (2010).

Artikel CAS Google Scholar

Yamaguchi, M. et al. VASCULAR-RELATED NAC-DOMAIN6 und VASCULAR-RELATED NAC-DOMAIN7 induzieren effektiv die Transdifferenzierung in Xylem-Gefäßelemente unter der Kontrolle eines Induktionssystems. Pflanzenphysiologie. 153, 906–914 (2010).

Artikel CAS PubMed PubMed Central Google Scholar

Zhong, R., Richardson, EA & Ye, ZH Zwei Transkriptionsfaktoren der NAC-Domäne, SND1 und NST1, wirken redundant bei der Regulierung der Sekundärwandsynthese in Fasern von Arabidopsis. Planta 225, 1603–1611 (2007).

Artikel CAS PubMed Google Scholar

Jokipii-Lukkari, S. et al. NorWood: eine Genexpressionsressource für Evo-Devo-Studien zur Entwicklung von Nadelholz. N. Phytol. 216, 482–494 (2017).

Artikel Google Scholar

Meesapyodsuk, D. & Qiu, X. Die Front-End-Desaturase: Struktur, Funktion, Evolution und biotechnologische Nutzung. Lipide 47, 227–237 (2012).

Artikel CAS PubMed Google Scholar

Sayanova, O., Haslam, R., Venegas Caleron, M. & Napier, JA Klonierung und Charakterisierung ungewöhnlicher Fettsäuredesaturasen aus Anemone leveillei: Identifizierung einer Acyl-Coenzym-A-C20-Δ5-Desaturase, die für die Synthese von Sciadodonsäure verantwortlich ist. Pflanzenphysiologie. 144, 455–467 (2007).

Artikel CAS PubMed PubMed Central Google Scholar

Xue, JA et al. Die Expression der Hefe-Acyl-CoA-∆9-Desaturase führt zur Akkumulation ungewöhnlicher einfach ungesättigter Fettsäuren in Sojabohnensamen. Biotechnologie. Lette. 35, 951–959 (2013).

Artikel CAS PubMed Google Scholar

Lim, ZL, Senger, T. & Vrinten, P. Vier Aminosäurereste beeinflussen die Substratkettenlänge und Regioselektivität der Δ4- und Δ5/6-Desaturasen von Siganus canaliculatus. Lipide 49, 357–367 (2014).

Artikel CAS PubMed Google Scholar

Buček, A., Vazdar, M., Tupec, M., Svatoš, A. & Pichová, I. Die Desaturasespezifität wird durch die physikalisch-chemischen Eigenschaften eines einzelnen Aminosäurerests im Substratbindungstunnel gesteuert. Berechnen. Struktur. Biotechnologie. J. 18, 1202–1209 (2020).

Artikel PubMed PubMed Central Google Scholar

Chen, M. et al. Hypomethylierte Regionen des Samengenoms sind mit Transkriptionsfaktor-Genen angereichert. Proz. Natl Acad. Wissenschaft. USA 115, E8315–E8322 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Niederhuth, CE et al. Weit verbreitete natürliche Variation der DNA-Methylierung innerhalb von Angiospermen. Genombiol. 17, 194 (2016).

Artikel PubMed PubMed Central Google Scholar

Ausin, I. et al. DNA-Methylom des 20-Gigabasen-Genoms der Gemeinen Fichte. Proz. Natl Acad. Wissenschaft. USA 113, E8106–E8113 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Bewick, AJ & Schmitz, RJ Genkörper-DNA-Methylierung in Pflanzen. Curr. Meinung. Pflanzenbiol. 36, 103–110 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Takuno, S., Ran, JH & Gaut, BS Evolutionsmuster der genetischen DNA-Methylierung variieren zwischen Landpflanzen. Nat. Pflanzen 2, 15222 (2016).

Artikel CAS PubMed Google Scholar

Lin, JY et al. Die Ähnlichkeit zwischen Sojabohnen- und Arabidopsis-Samenmethylomen und der Verlust der Nicht-CG-Methylierung haben keinen Einfluss auf die Samenentwicklung. Proz. Natl Acad. Wissenschaft. USA 114, E9730–E9739 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Chen, F., Tobimatsu, Y., Havkin-Frenkel, D., Dixon, RA & Ralph, J. Ein Polymer von Kaffeylalkohol in Pflanzensamen. Proz. Natl Acad. Wissenschaft. USA 109, 1772–1777 (2012).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Hiraide, H. et al. Lokalisierte Laccase-Aktivität moduliert die Verteilung von Ligninpolymeren im Gymnosperm-Kompressionsholz. N. Phytol. 230, 2186–2199 (2021).

Artikel CAS Google Scholar

Cosgrove, DJ Lockerung pflanzlicher Zellwände durch Expansine. Natur 407, 321–326 (2000).

Artikel ADS CAS PubMed Google Scholar

Vigeolas, H., van Dongen, JT, Waldeck, P., Huhn, D. & Geigenberger, P. Der Lipidspeicherstoffwechsel wird durch die vorherrschenden niedrigen Sauerstoffkonzentrationen in sich entwickelnden Rapssamen eingeschränkt. Pflanzenphysiologie. 133, 2048–2060 (2003).

Artikel CAS PubMed PubMed Central Google Scholar

Murray, MG & Thompson, WF Schnelle Isolierung hochmolekularer Pflanzen-DNA. Nukleinsäuren Res. 8, 4321–4325 (1980).

Artikel CAS PubMed PubMed Central Google Scholar

Zhu, W. et al. Veränderte Chromatin-Verdichtung und Histon-Methylierung fördern die nicht-additive Genexpression in einem interspezifischen Arabidopsis-Hybrid. Genombiol. 18, 157 (2017).

Artikel PubMed PubMed Central Google Scholar

Cheng, H., Concepcion, GT, Feng, X., Zhang, H. & Li, H. Haplotyp-aufgelöste De-novo-Assemblierung unter Verwendung von Phased-Assembly-Graphen mit Hifiasmus. Nat. Methoden 18, 170–175 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Roach, MJ, Schmidt, S. & Borneman, AR Purge Haplotigs: Synteniereduktion für diploide Genomassemblierungen der dritten Generation. BMC Bioinforma. 19, 460 (2018).

Artikel CAS Google Scholar

Bolger, AM, Lohse, M. & Usadel, B. Trimmomatic: ein flexibler Trimmer für Illumina-Sequenzdaten. Bioinformatik 30, 2114–2120 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Zhang, Nat. Pflanzen 5, 833–845 (2019).

Artikel CAS PubMed Google Scholar

Li, H. & Durbin, R. Schnelle und genaue Ausrichtung kurzer Lesevorgänge mit der Burrows-Wheeler-Transformation. Bioinformatik 25, 1754–1760 (2009).

Artikel CAS PubMed PubMed Central Google Scholar

Xu, Z. & Wang, H. LTR_FINDER: ein effizientes Werkzeug zur Vorhersage von LTR-Retrotransposons voller Länge. Nukleinsäuren Res. 35, W265–W268 (2007).

Artikel PubMed PubMed Central Google Scholar

Flynn, JM et al. RepeatModeler2 für die automatisierte genomische Entdeckung transponierbarer Elementfamilien. Proz. Natl Acad. Wissenschaft. USA 117, 9451–9457 (2020).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Bao, W., Kojima, KK & Kohany, O. Repbase Update, eine Datenbank repetitiver Elemente in eukaryotischen Genomen. Mob. DNA 6, 11 (2015).

Artikel PubMed PubMed Central Google Scholar

Tarailo-Graovac, M. & Chen, N. Verwenden von RepeatMasker zur Identifizierung repetitiver Elemente in Genomsequenzen. Curr. Protokoll. Bioinforma. 25, Kapitel 4: Einheit 4.10 (2009).

Artikel Google Scholar

Benson, G. Tandem Repeats Finder: ein Programm zur Analyse von DNA-Sequenzen. Nukleinsäuren Res. 27, 573–580 (1999).

Artikel CAS PubMed PubMed Central Google Scholar

Ellinghaus, D., Kurtz, S. & Willhoeft, U. LTRharvest, eine effiziente und flexible Software zur De-novo-Erkennung von LTR-Retrotransposons. BMC Bioinforma. 9, 18 (2008).

Artikel Google Scholar

Edgar, RC MUSCLE: Mehrfachsequenz-Alignment mit hoher Genauigkeit und hohem Durchsatz. Nukleinsäuren Res. 32, 1792–1797 (2004).

Artikel CAS PubMed PubMed Central Google Scholar

Altschul, SF, Gish, W., Miller, W., Myers, EW & Lipman, DJ Einfaches Suchwerkzeug für die lokale Ausrichtung. J. Mol. Biol. 215, 403–410 (1990).

Artikel CAS PubMed Google Scholar

She, R., Chu, JS, Wang, K., Pei, J. & Chen, N. GenBlastA: Ermöglicht BLAST die Identifizierung homologer Gensequenzen. Genomres. 19, 143–149 (2009).

Artikel CAS PubMed PubMed Central Google Scholar

Birney, E., Clamp, M. & Durbin, R. GeneWise und genomwise. Genomres. 14, 988–995 (2004).

Artikel CAS PubMed PubMed Central Google Scholar

Trapnell, C., Pachter, L. & Salzberg, SL TopHat: Entdeckung von Spleißverbindungen mit RNA-Seq. Bioinformatik 25, 1105–1111 (2009).

Artikel CAS PubMed PubMed Central Google Scholar

Roberts, A., Pimentel, H., Trapnell, C. & Pachter, L. Identifizierung neuer Transkripte in annotierten Genomen mithilfe von RNA-Seq. Bioinformatik 27, 2325–2329 (2011).

Artikel CAS PubMed Google Scholar

Grabherr, MG et al. Vollständige Transkriptomassemblierung aus RNA-Seq-Daten ohne Referenzgenom. Nat. Biotechnologie. 29, 644–652 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Haas, BJ et al. Verbesserung der Annotation des Arabidopsis-Genoms mithilfe maximaler Transkript-Alignment-Assemblys. Nukleinsäuren Res. 31, 5654–5666 (2003).

Artikel CAS PubMed PubMed Central Google Scholar

Stanke, M. et al. AUGUSTUS: Ab-initio-Vorhersage alternativer Transkripte. Nukleinsäuren Res. 34, W435–W439 (2006).

Artikel CAS PubMed PubMed Central Google Scholar

Pertea, M., Salzberg, SL & Majoros, WH TigrScan und GlimmerHMM: zwei Open-Source-Ab-initio-Genfinder für eukaryotische Gene. Bioinformatik 20, 2878–2879 (2004).

Artikel PubMed Google Scholar

Korf, I. Genfindung in neuartigen Genomen. BMC Bioinforma. 5, 59 (2004).

Artikel Google Scholar

Alioto, T., Blanco, E., Parra, G. & Guigó, R. Verwendung von Geneid zur Identifizierung von Genen. Curr. Protokoll. Bioinforma. 64, e56 (2018).

Artikel Google Scholar

Burge, C. & Karlin, S. Vorhersage vollständiger Genstrukturen in der menschlichen genomischen DNA. J. Mol. Biol. 268, 78–94 (1997).

Artikel CAS PubMed Google Scholar

Haas, BJ et al. Automatisierte Annotation der eukaryotischen Genstruktur mit EVidenceModeler und dem Programm zum Zusammenstellen gespleißter Alignments. Genombiol. 9, R7 (2008).

Artikel PubMed PubMed Central Google Scholar

Morishima, K., Tanabe, M., Furumichi, M., Kanehisa, M. & Sato, Y. KEGG: Neue Perspektiven auf Genome, Signalwege, Krankheiten und Medikamente. Nukleinsäuren Res. 45, 353–361 (2016).

Google Scholar

Mitchell, A. et al. InterProScan 5: Proteinfunktionsklassifizierung im Genommaßstab. Bioinformatik 30, 1236–1240 (2014).

Artikel PubMed PubMed Central Google Scholar

Emms, DM & Kelly, S. OrthoFinder: Phylogenetische Orthologie-Inferenz für die vergleichende Genomik. Genombiol. 20, 238 (2019).

Artikel PubMed PubMed Central Google Scholar

Nguyen, LT, Schmidt, HA, von Haeseler, A. & Minh, BQ IQ-TREE: ein schneller und effektiver stochastischer Algorithmus zur Schätzung von Maximum-Likelihood-Phylogenien. Mol. Biol. Entwicklung 32, 268–274 (2015).

Artikel CAS PubMed Google Scholar

De Bie, T., Cristianini, N., Demuth, JP & Hahn, MW CAFE: ein Computertool zur Untersuchung der Evolution von Genfamilien. Bioinformatik 22, 1269–1271 (2006).

Artikel PubMed Google Scholar

Wang, Y. et al. MCScanX: ein Toolkit zur Erkennung und evolutionären Analyse der Syntenie und Kollinearität von Genen. Nukleinsäuren Res. 40, 49 (2012).

Artikel ADS Google Scholar

Yang, Z. PAML 4: Phylogenetische Analyse nach Maximum Likelihood. Mol. Biol. Entwicklung 24, 1586–1591 (2007).

Artikel CAS PubMed Google Scholar

Langmead, B., Trapnell, C., Pop, M. & Salzberg, SL Ultraschnelle und speichereffiziente Ausrichtung kurzer DNA-Sequenzen auf das menschliche Genom. Genombiol. 10, R25 (2009).

Artikel PubMed PubMed Central Google Scholar

Krueger, F. & Andrews, SR Bismark: ein flexibler Aligner und Methylierungs-Caller für Bisulfit-Seq-Anwendungen. Bioinformatik 27, 1571–1572 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Park, Y. & Wu, H. Differenzielle Methylierungsanalyse für BS-seq-Daten unter allgemeinem experimentellen Design. Bioinformatik 32, 1446–1453 (2016).

Artikel CAS PubMed Google Scholar

Dobin, A. et al. STAR: ultraschneller universeller RNA-seq-Aligner. Bioinformatik 29, 15–21 (2013).

Artikel CAS PubMed Google Scholar

Anders, S., Pyl, PT & Huber, W. HTSeq – ein Python-Framework für die Arbeit mit Hochdurchsatz-Sequenzierungsdaten. Bioinformatik 31, 166–169 (2015).

Artikel CAS PubMed Google Scholar

Love, MI, Huber, W. & Anders, S. Moderierte Schätzung der Faltungsänderung und Streuung für RNA-seq-Daten mit DESeq2. Genombiol. 15, 550 (2014).

Artikel PubMed PubMed Central Google Scholar

Li, Y. et al. HGT ist bei Insekten weit verbreitet und trägt zur männlichen Balz bei Schmetterlingen bei. Zelle 185, 2975–2987.e10 (2022).

Artikel CAS PubMed Google Scholar

Referenzen herunterladen

Diese Forschung wurde durch Zuschüsse der National Natural Science Foundation of China (NSFC) an JW (Zuschuss-Nr. U20A2049), LS (Zuschuss-Nr. 31971699), XS (Zuschuss-Nr. 32102318), das Key Research and Development Program von Zhejiang, unterstützt Provinz an HL (Zuschuss Nr. 2021C02001), das Scientific Research Startup Fund Project der Zhejiang A&F University an HL (Zuschuss Nr. 2018FR028) und der Zuschuss des State Key Laboratory of Subtropical Waldbau an JW (Zuschuss Nr. ZY20180312 und ZY20180209). Die Autoren danken Dr. Emily ED Coffey vom Atlanta Botanical Garden (USA) und Prof. Mark W. Schwartz von der University of California, Davis für die Bereitstellung von Pflanzenproben.

Diese Autoren haben gleichermaßen beigetragen: Heqiang Lou, Lili Song, Xiaolong Li.

Staatliches Schlüssellabor für subtropischen Waldbau, Zhejiang A&F University, Hangzhou, 311300, Zhejiang, China

Heqiang Lou, Lili Song, Weijie Chen, Yadi Gao, Shan Zheng und Jiasheng Wu

Kollaboratives Innovationszentrum für effiziente und umweltfreundliche landwirtschaftliche Produktion in Berggebieten der Provinz Zhejiang, Zhejiang A&F University, Hangzhou, 311300, Zhejiang, China

Xiaolong Li & Xuepeng Sun

Schlüssellabor für Qualitäts- und Sicherheitskontrolle für subtropisches Obst und Gemüse, Ministerium für Landwirtschaft und ländliche Angelegenheiten, Hangzhou, 311300, Zhejiang, China

Xiaolong Li & Xuepeng Sun

Novogene Bioinformatics Institute, 100083, Peking, China

Ich grüße Zi

Boyce Thompson Institute, Cornell University, Ithaca, NY, 14853, USA

Zhangjun Fei

US-Landwirtschaftsministerium – Agrarforschungsdienst, Robert W. Holley Center for Agriculture and Health, Ithaca, NY, 14853, USA

Zhangjun Fei

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

JW, XS, HL und LS konzipierten und betreuten das Projekt. WC, YG und SZ sammelten Proben und führten transgene Experimente durch. XS, XL und HZ erstellten Bibliotheken und führten bioinformatische Analysen durch. XS und HL haben das Manuskript geschrieben. ZF und JW haben das Manuskript überarbeitet.

Korrespondenz mit Zhangjun Fei, Xuepeng Sun oder Jiasheng Wu.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Nature Communications dankt Amanda De La Torre, Liang Guo, Nathaniel Street und Haifeng Wang für ihren Beitrag zum Peer-Review dieser Arbeit. Peer-Reviewer-Berichte sind verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Lou, H., Song, L., Li, X. et al. Das Genom von Torreya grandis beleuchtet den Ursprung und die Entwicklung der Gymnosperm-spezifischen Sciadodonsäure-Biosynthese. Nat Commun 14, 1315 (2023). https://doi.org/10.1038/s41467-023-37038-2

Zitat herunterladen

Eingegangen: 28. Oktober 2022

Angenommen: 28. Februar 2023

Veröffentlicht: 10. März 2023

DOI: https://doi.org/10.1038/s41467-023-37038-2

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.