Télomère
Nature Genetics volume 55, pages 1390-1399 (2023)Citer cet article
6669 Accès
58 Altmétrique
Détails des métriques
Les pangénomes donnent accès à une représentation précise de la diversité génétique des espèces, tant en termes de polymorphismes de séquence que de variantes structurelles (SV). Ici, nous avons généré le panel d'assemblage de référence de Saccharomyces cerevisiae (ScRAP) comprenant des génomes de qualité de référence pour 142 souches représentant la diversité phylogénétique et écologique de l'espèce. Le ScRAP comprend des assemblages d'haplotypes par étapes pour plusieurs isolats hétérozygotes diploïdes et polyploïdes. Nous avons identifié environ (environ) 4 800 SV non redondantes qui offrent une vue d’ensemble de la diversité génomique, y compris la dynamique de la longueur des télomères et des éléments transposables. Nous avons découvert des cas fréquents d'aneuploïdies complexes dans lesquels de gros chromosomes subissaient d'importantes délétions et translocations. Nous avons constaté que les SV peuvent avoir un impact sur l'expression des gènes à proximité des points d'arrêt et contribuer de manière substantielle à l'évolution du répertoire génétique. Nous avons également découvert que les régions acquises horizontalement s'insèrent aux extrémités des chromosomes et peuvent générer de nouveaux télomères. Dans l’ensemble, le ScRAP démontre l’avantage d’un pangénome pour comprendre l’évolution du génome à l’échelle de la population.
Le séquençage à lecture longue d’une seule molécule donne accès à des assemblages génomiques sans interruption, y compris des régions chromosomiques répétitives qui restent généralement non assemblées avec les technologies précédentes. L’augmentation rapide de la contiguïté du génome humain1, notamment grâce aux lectures ultra-longues de la technologie Oxford Nanopore (ONT)2, en est le meilleur exemple. Récemment, le consortium télomère à télomère (T2T) a publié le premier assemblage complet « T2T » de deux chromosomes humains3,4,5, suivi de la publication du premier génome humain sans interruption, comprenant de nouvelles séquences de près de 200 Mo6. Les génomes végétaux complexes et les organismes modèles classiques ont également vu des améliorations dans la contiguïté des assemblages, grâce aux technologies à lecture longue7,8,9,10,11.
Ces progrès ont permis à quelques espèces d'avoir plusieurs génomes contigus de type référence, qui incluent des organismes modèles et des espèces d'importance anthropocentrique telles que Escherichia coli12, Drosophila melanogaster10,13, Solanum lycopersicum14, Glycine max15, Oryza sativa8,16, Bombyx mori17 et les humains18,19. ,20. La levure de boulanger, Saccharomyces cerevisiae, possède au total 68 assemblages génomiques à lecture longue de souches non références21,22,23,24,25,26,27,28,29,30. Ces données ont été utilisées pour quantifier les améliorations de contiguïté par rapport aux données à lecture courte25, créer des cartes d'éléments transposables (ET) à l'échelle du génome22,24,25, caractériser les régions subtélomériques29, mettre en phase les haplotypes et détecter de grandes variantes structurelles (SV)22,25, 26,29,30. Cependant, la contiguïté des assemblages génomiques disponibles varie considérablement chez S. cerevisiae et seul un petit sous-ensemble d'entre eux a atteint la contiguïté au niveau des chromosomes. De plus, l'échantillonnage reste limité, de nombreux clades ne disposant pas d'un génome de référence représentatif et aucun génome polyploïde n'a été inclus malgré leur abondance (11,5% des isolats)31. Enfin, la mise en place progressive des haplotypes des génomes diploïdes et polyploïdes est un défi, empêchant l'inférence d'haplotypes et les mesures d'hétérozygotie.
Ici, nous avons généré le panel d'assemblages de référence de S. cerevisiae (ScRAP) comprenant des assemblages du génome T2T pour 142 isolats qui échantillonnent l'espace génomique de l'espèce. La qualité de ces génomes dépasse l’étalon-or de référence et nous permet de caractériser avec précision les SV et les régions complexes à une échelle qui n’a pas encore été atteinte chez d’autres espèces.
Le ScRAP comprend 142 souches qui couvrent la répartition géographique et écologique de l'espèce ainsi que ses niveaux de ploïdie et d'hétérozygotie (Fig. 1a, b et Tableau supplémentaire 1). Le panel comprend 197 assemblages de génomes nucléaires et 136 assemblages de génomes mitochondriaux, dont 100 génomes nouvellement séquencés, parmi lesquels des assemblages résolus par haplotype sont disponibles pour les génomes diploïdes et polyploïdes (Tableau 1 et Tableaux supplémentaires 1 à 3). Les mesures génomiques révèlent des niveaux élevés de contiguïté et d'exhaustivité dans tous les assemblages (note complémentaire 1). Le ScRAP fournit des génomes de qualité de référence pour tous les principaux clades phylogénétiques 31,32 (Fig. 1c et Note complémentaire 2). Les assemblages diploïdes résolus par haplotype T2T montrent que les haplotypes frères (HP; haplotype 1 (HP1) et haplotype 2 (HP2)) sont toujours regroupés dans l'arbre et partagent le même profil de mélange (Fig. 1c, d). La différence la plus frappante a été observée entre les deux HP de la souche Wine/European MC9 (AIS) pour lesquelles la longueur de branche de HP2 (AIS_HP2) est disproportionnellement plus longue par rapport à toutes les autres branches terminales (Fig. 1c), qui est déterminée par le chromosome. -introgressions à grande échelle des chromosomes VI et VII d'une espèce très divergente (voir Introgressions de chromosomes entiers).