Rock Tech Lithium completa el estudio de proyecto financiable para su proyecto Guben Converter
Mar 06, 2023Nuevo informe legal apoya la controvertida línea ferroviaria de Utah a la que se oponen el condado de Eagle, Glenwood Springs y otros
Mar 08, 2023WMNF
Mar 10, 2023Folleto del Impuesto sobre Sociedades 2022 Water's
Mar 12, 2023Privado vs. Público: ¿Es la propuesta de Hábitat para construir un
Mar 14, 2023Entero
Scientific Reports volumen 12, Número de artículo: 5556 (2022) Citar este artículo
2518 Accesos
1 Citas
7 Altmetric
Detalles de métricas
El sorgo (Sorghum bicolor L. (Moench)) es el quinto cereal económicamente más importante del mundo y es un alimento básico particularmente en los trópicos semiáridos de África y Asia. Las ganancias genéticas en este cultivo pueden beneficiarse de parientes silvestres como Sorghum halepense. Las secuencias del genoma, incluidas las de esta especie silvestre, pueden impulsar el estudio de la variación intraespecífica y de todo el genoma para diseccionar la base genética y mejorar rasgos importantes en el sorgo. La resecuenciación del genoma completo realizada en este trabajo en un panel de 172 poblaciones de líneas avanzadas S. bicolor y S. bicolor × S. halepense (SbxSh) generó un total de 567 046 841 SNP, 91 825 474 indels, 1 532 171 SV y 4 973 961 CNV. Claramente, SbxSh acumuló más variantes y mutaciones con poderosos efectos sobre la diferenciación genética. Un total de 5.548 genes privados para SbxSh asignados a términos de enriquecimiento GO de procesos biológicos; 34 de estos genes asignados al desarrollo del sistema radicular (GO: 0022622). Se descubrió que dos de los genes específicos de la raíz, es decir, ROOT PRIMORDIUM DEFECTIVE 1 (RPD1; GeneID: 8054879) y RETARDED ROOT GROWTH (RRG, GeneID: 8072111), ejercen un efecto directo sobre el crecimiento y desarrollo de la raíz. Este es el primer informe sobre la resecuenciación del genoma completo de un panel de sorgo que incluye el genoma de S. halepense. La extracción de variantes y genes privados de esta especie silvestre puede proporcionar conocimientos capaces de impulsar la mejora genética del sorgo, en particular el rasgo de perenneidad que cumple con las prácticas agroecológicas, la agricultura sostenible y la resiliencia al cambio climático.
El sorgo (Sorghum bicolor L. (Moench), 2n = 2x = 20) es el quinto cereal económicamente más importante del mundo1; es un alimento básico particularmente en los trópicos semiáridos de África y Asia, representando 6,5 millones de kilómetros cuadrados en más de 55 países, y hogar de más de 2 mil millones de personas de las cuales 600 millones se consideran pobres2. El sorgo se está volviendo popular en la industria alimentaria en todo el mundo, debido al aumento de la demanda de cereales especiales sin gluten ricos en compuestos que promueven la salud y que estabilizan la oxidación de los alimentos3,4. De hecho, los granos de sorgo, particularmente las variedades rojas, exhiben los valores más altos de capacidad antioxidante total (400–500 μmol de Trolox equiv/g) entre varios cultivos (p. ej., trigo, arroz, avena, cebada, maíz, papa)3,5 y alimentos vegetales fuentes de antioxidantes naturales6,7. Además de la alimentación humana, el sorgo también se utiliza para otros fines, como la energía y la nutrición animal8; también es resistente a las tensiones bióticas y abióticas, se adapta a diversos entornos, requiere pocos insumos agrícolas, todo lo cual lo convierte en un cultivo importante para mejorar la seguridad alimentaria y de productos básicos en todo el mundo9,10,11.
La secuencia del genoma de S. bicolor se publicó por primera vez en 200912 y la versión actual 3.1.1 tiene un tamaño de 732,2 megabases (Mb) e informa sobre más de 34.000 genes anotados, varios de los cuales pueden utilizarse en introgresiones genéticas y mejoras de rendimiento asistidas por genómica y la calidad de los productos de este cultivo13. Se espera que el genoma de referencia del sorgo facilite los experimentos de resecuenciación y las investigaciones genéticas en el sorgo cultivado y su acervo genético silvestre. En este trabajo, volvimos a secuenciar el genoma completo y presentamos la información comparativa de S. bicolor y S. bicolor × S. halepense líneas endogámicas recombinantes; hasta donde sabemos, no se han informado estudios de resecuenciación que hayan dado cuenta de tales poblaciones al mismo tiempo.
El sorgo, como cualquier otro cultivo, puede mejorarse genéticamente mediante la introgresión de factores genéticos de parientes silvestres14. Los mejoradores de sorgo han mostrado interés en cruces interespecíficos entre Sorghum bicolor y Johnsongrass [Sorghum halepense (L.) Pers.], que es una especie silvestre alotetraploide natural (2n = 4x = 40) que se cree se originó por la hibridación espontánea entre S. bicolor y S. propinquum (Kunth) Hitchc., seguida de duplicación cromosómica15. La evidencia disponible muestra que Johnsongrass puede conferir una fuerte perenneidad e hibernación en el trasfondo genético de S. bicolor14,16,17,18,19. La ploidía de Sorghum halepense implica que su hibridación con S. bicolor requiere que esta última sea tetraploide inducida o diploide masculina estéril genética citoplásmica; en ambos casos se genera descendencia principalmente tetraploide19,20, pero se observaron casos de descendencia diploide21,22. La importancia de introgresar la perenneidad en los cultivos puede explicarse por la búsqueda de funciones agroecológicas de un cultivar perenne como cultivo de cobertura de larga duración. Los cultivos de cobertura son amigables con el medio ambiente, ayudan a evitar suelos desnudos, mejoran la salud del suelo, reducen los insumos agrícolas, fomentan la biodiversidad, lo que puede hacer que la producción agrícola sea más resistente a las adversidades del cambio climático23,24. Los suelos desnudos representan uno de los mayores fracasos de la intensificación agrícola convencional, ya que provocan la pérdida de nutrientes del suelo y de las plantas principalmente por erosión y lixiviación. Los cultivos perennes crean una cobertura permanente del suelo, reciclan y detienen la pérdida de nutrientes de los fertilizantes, lo que permite una reducción drástica de las tasas de aplicación de fertilizantes y mejora la salud del suelo. Además, al cubrir permanentemente el suelo, los cultivos perennes limitan la pérdida de humedad del suelo por evaporación, garantizan un alto nivel de materia orgánica del suelo y una biología activa del suelo, lo que a su vez mejora las propiedades químicas y físicas del suelo y ayuda a neutralizar las emisiones de gases de efecto invernadero, en particular a través de captura de carbono y, por lo tanto, mitiga el cambio climático25.
Al igual que en otros estudios similares26, la resecuenciación de las poblaciones de sorgo descrita en este trabajo permite capturar la variación natural en el acervo genético a través de la identificación de millones de variantes entre accesiones de parientes de S. halepense cultivadas y silvestres. Dichos polimorfismos de alta confianza se utilizarán en estudios de desequilibrio de ligamiento y genética directa para desentrañar la base genética de características vegetales complejas de importancia agronómica y el desarrollo de cultivares resistentes al cambio climático.
Los mejoradores de sorgo que trabajan en la introgresión de la perennidad en el fondo anual de S. bicolor seleccionan el aspecto general de la planta de sorgo bicolor además del rasgo de hibernación. También hemos observado a partir de nuestra experiencia en los últimos años14 que los retrocruces son los más atractivos ya que muestran características muy comparables al sorgo domesticado27 (forma de panícula y compacidad, tamaño de semilla grande y audaz, ausencia de rotura de semillas, etc.) que simples, dobles , o cruces de tres vías. Por lo tanto, utilizamos los datos producidos en este y estudios anteriores de nuestro laboratorio para investigar la contribución del sorgo halepense en hibridaciones controladas de S. bicolor × S. halepense con particular interés en los retrocruces que involucran dos dosis de S. bicolor como padre recurrente. En este trabajo, describimos el primer estudio de resecuenciación del genoma completo, evaluando simultáneamente S. bicolor y la progenie de cruces de S. bicolor × S. halepense; realizamos una caracterización estructural y funcional integral de 172 líneas, 19 de las cuales eran líneas puras recombinantes que heredaron diferentes proporciones de S. bicolor y S. halepense. Interrogamos el genoma completo de estas poblaciones y producimos un gran conjunto de variantes robustas y de alta confianza que sustentarán el mejoramiento y otras investigaciones genéticas y genómicas en sorgo, incluido el mejoramiento asistido por genómica.
Ciento setenta y dos líneas de sorgo evaluadas en este estudio se agruparon en dos poblaciones diferentes de 153 genotipos de S. bicolor y 19 líneas puras recombinantes de S. bicolor × S. halepense (Fig. 1). El estadístico F (Fst) que mide la estructura genética y el nivel de diferenciación genética28,29 fue significativa y moderadamente alto (Fst = 0,31, p = 0,01); Los valores de Fst van de 0 en el caso de panmixis a 1 en el caso de que las poblaciones no compartan diversidad genética. Las dos primeras dimensiones de las coordenadas principales explicaron el 70,9% de la diversidad genética total existente en las poblaciones estudiadas. Se volvió a secuenciar el genoma completo de las ciento setenta y dos líneas de sorgo y se construyó un número correspondiente (172) de bibliotecas de secuenciación de extremos emparejados, cada una con un tamaño de inserción de alrededor de 300 pares de bases. La resecuenciación produjo 22 880 millones de lecturas emparejadas, lo que resultó en 3,43 billones de bases (nucleótidos) y 2,6 TB de datos sin procesar de alta calidad. En última instancia, se produjeron un total de 21,70 mil millones y 3,25 billones de lecturas y bases limpias de extremos emparejados, respectivamente. En general, el 94,54 % del total de lecturas limpias mostró un valor de calidad Q20 ≥ 94,54 %, lo que indica una alta calidad de los datos. Sorghum bicolor (Sb) y S. bicolor × S. halepense (SbxSh) mostraron una calidad de lecturas limpias comparable (Q20 = 96,17–96,38 % y Q30 = 87,91–88,22 %), número de lecturas limpias (125,7–126,19 × 106) y bases (18,82-18,89 × 109), y la relación bases limpias:bases crudas (94,64-94,89%). Sin embargo, la tasa de guanina-citosina (GC) fue mayor en SbxSh en relación con Sb (43,42 % a frente a 43,26 % b) en los datos limpios.
Análisis de diferenciación genética en poblaciones Sb y SbxSh. Las elipses se dibujan teniendo en cuenta el intervalo de confianza del 95% y la distancia euclidiana desde el centro "o". Los genotipos fuera de las elipses son valores atípicos74.
Las lecturas de secuencia se alinearon con el genoma de referencia de Sorghum bicolor (BTx623), cuyo tamaño era de 732 200 000 pb, mientras que el tamaño efectivo era de 675 973 270 pb (base N excluida) y un contenido de GC del 41,82 %. La tasa de mapeo, es decir, el porcentaje de cobertura de la referencia por lecturas de las muestras de sorgo varió de 89.15 a 95.18% con una media de 92%. El porcentaje de lecturas mapeadas y el de bases mapeadas fueron idénticos y oscilaron entre 82,65 y 99,92 % con un promedio de 99,40 %. La profundidad de mapeo efectiva, es decir, LN/G, donde L es la longitud de lectura, N es el número de lecturas y G es la longitud del genoma haploide, estaba entre 23,17X y 34,38X. En este trabajo, SbxSh y Sb mostraron lecturas mapeadas comparables (99,04–99,45 %), bases mapeadas (99,04–99,45 %), profundidad de secuenciación después del mapeo (26,54X–26,64X), mientras que SbxSh mostró una tasa de cobertura porcentual estadísticamente significativa más alta (94,87 a frente a 91.62b), pero un porcentaje más bajo de bases de aciertos únicos (81.96a frente a 77.58b) y lecturas de aciertos únicos (82.39a frente a 78.31b).
La alineación de la secuencia de las líneas de sorgo objetivo con el genoma de referencia BTx623, los modelos genéticos y la información derivada del genoma de referencia permitieron identificar un gran número de SNP, InDels, CNV y SV (Tabla 1; Fig. 2). Se descubrió un total de 567 046 841 SNP a partir de estos genomas de sorgo. En promedio, se observaron 10.515.367,4 SNP por individuo, de los cuales 1.855.062 se ubicaron en las regiones génicas. El análisis estadístico mostró que SbxSh tenía más SNP totales y heterocigotos, SNP sinónimos_CDS, nonsyn_CDS, exónicos, génicos, intrónicos, mRNA, pseudogénicos, transcriptos y tRNA, mientras que Sb mostró más SNP homocigotos. Entre los SNP sinónimos y no sinónimos mapeados en las regiones de codificación en cualquiera de las poblaciones, los SNP sinónimos representaron el 49 % y el 54 %, respectivamente, en las poblaciones Sb y SbxSh. La población SbxSh contenía el 81 % y el 78 %, respectivamente, de todos los SNP sinónimos y no sinónimos. A diferencia de las mutaciones sinónimas, las mutaciones no sinónimas causan variaciones en la codificación de aminoácidos y se considera que desempeñan un papel importante en el cambio del fenotipo de los organismos. Además, las mutaciones no sinónimas también son fuertes candidatas para explicar la diversidad fenotípica entre los diferentes individuos de una población.
Distribución cromosómica de la información WGRS en líneas Sb y BC1 SbxSh, y datos GWAS de las poblaciones evaluadas74. El eje x corresponde a la coordenada genómica. Pistas 1–4: visualice la densidad genómica de las regiones (definida como la fracción de una ventana genómica que está cubierta por regiones genómicas). Pistas 5, 8: los SNP significativos y los genes candidatos se muestran de acuerdo con sus coordenadas genómicas (eje x), mientras que los valores y se establecieron con el único propósito de mejorar la resolución (legibilidad) de los SNP correspondientes y los genes candidatos.
Analizamos más a fondo la distribución de los SNP de gran efecto, es decir, aquellos con potencial para desactivar las funciones de los genes26,30. En este trabajo, los SNPS de gran efecto incluyeron codón de parada prematuro, codón de parada a codón sin parada, codón de inicio a codón sin inicio y sitios de empalme. Se encontró que dentro de los 10 140 SNP que participan en la terminación prematura del codón, 2970 SNP interrumpen el empalme de los sitios donantes o aceptores del genoma, 13 976 SNP están relacionados con la alteración de los residuos de metionina de iniciación y 1144 SNP reemplazan los terminadores con ciertos residuos de aminoácidos que conducen a una mayor duración. ORF. Las estadísticas se representan en la Fig. 3, donde SbxSh mostró un mayor número de SNP de gran efecto que Sb. En la población de SbxSh, se encontró un promedio de 1967, 500, 370 y 700 SNP que se esperaba que indujeran el codón de parada prematuro, el codón de parada al codón sin parada, el codón de inicio al codón sin inicio y los sitios de empalme, respectivamente, mientras que en Sb se encontró un máximo de 1183, 340, 100 y 340, respectivamente. En ambas poblaciones, los SNP que inducen el codón de parada prematuro fueron los más representados con respecto a los otros SNP de gran efecto.
Estadísticas de diferentes tipos de SNP de efecto grande. Las entradas resecuenciadas se representan en el eje x, los números en la parte superior de cada barra representan el número de SNP74.
Se identificaron un total de 91.825.474 indeles de los cuales el 24% y el 76% residían en Sb y SbxSh, respectivamente; las inserciones individuales medias (211.283,62 frente a 649.218,63) y las eliminaciones (221.602,78 frente a 697.826,37) fueron estadísticamente más altas en SbxSh en relación con la población de Sb. La distribución en todo el genoma de InDels cortos (1–10 pb) mostró un número menor de estas variantes en genes y regiones codificantes en comparación con Pseudogenes y mRNA, por ejemplo (Tabla 1). Nuestro resultado muestra que los indeles que no son múltiplos de 3 pb y producen mutaciones de cambio de marco son particularmente poco comunes en las regiones codificantes. La mutación de cambio de marco en la región de CDS, la mutación de cambio de 3X en la región de CDS, la mutación de cambio de 3X en la fase 0 de la región de CDS y la mutación de cambio de 3X en la fase 0 de la región de CDS fueron estadísticamente más altas en SbxSh que en Sb, es decir, 16,544, 19,780.74, 6301,53, 13479,21 frente a 5954,58, 6684,15, 2114,42, 4569,73, respectivamente. Una mutación de cambio de marco resulta de una inserción o eliminación de un número de nucleótidos que no es un múltiplo de tres. El cambio en el marco de lectura altera cada aminoácido después del punto de la mutación y da como resultado una proteína no funcional. Los efectos comparativos del cambio de marco (p. ej., 1, 2, 4, 5, 7, 8, 10 pb) sin cambio de cuadro (p. ej., 3, 6, 9 pb) ) muestra que los InDels cortos anteriores brindan una explicación mucho más poderosa de la diferencia de rasgos entre individuos30.
En este estudio, se identificó un total de 1.532.171 SV y se encontró distribuido de manera estadísticamente comparable entre las dos poblaciones. De los SV observados, Sb y SbxSh mostraron números medios individuales estadísticamente comparables de deleciones (4202 frente a 4119), otros SV (4699 frente a 4594), pero SbxSh mostró más inserciones que Sb, es decir, 72,47 frente a 21,01 número de SV medio individual. Se generó un total de 4.973.961 CNV de toda la población, con SbxSh produciendo un número estadísticamente mayor de CNV que Sb (41.296,21 frente a 27.381,26), mayor regulación al alza de CNV (16.650,26 frente a 10.567,82) y regulación a la baja (24.214,95 frente a 16.345,06) ).
Una de nuestras hipótesis de trabajo fue que parte de la variación genética identificada podría contribuir a la diferenciación fenotípica entre S. bicolor y S. bicolor × S. halepense, lo que nos llevó a centrar nuestro análisis en los SNP en regiones génicas. Los mejoradores de sorgo que trabajan en la introgresión de la perennidad en el fondo anual de S. bicolor seleccionan el aspecto general de la planta de sorgo bicolor además del rasgo de hibernación. También observamos a partir de nuestra experiencia en los últimos años14 que los retrocruces son los más atractivos, ya que muestran características estrechamente comparables al sorgo domesticado (forma de la panícula, tamaño de la semilla, etc.) que los cruces simples, dobles o triples. Por lo tanto, utilizamos los datos producidos en este y estudios anteriores de nuestro laboratorio para investigar la contribución de Sorghum halepense en hibridaciones controladas de SbxSh. Como muestra la Fig. 2, la línea de retrocruzamiento SbxSh9 tiene más genes y más SNP, CNV e indeles que S. bicolor Sb1; sin embargo, las dos líneas mostraron un número comparable de SV. El mismo patrón se observó en todas las poblaciones. La densidad de genes, SNP, indeles y SV aumenta desde la región pericentromérica hacia los telómeros, y los SNP/genes e indeles cortos muestran un patrón de distribución similar. En ambas poblaciones, la distribución de las CNV fue homogénea desde los centrómeros hasta los telómeros en todos los cromosomas. Además, SNP significativos relacionados con la biomasa de sorgo y genes candidatos recientemente descubiertos8 en estas poblaciones, es decir, genes Dw (Dw1, Dw2, Dw3, Dw4), genes Ma (Ma1, Ma2, Ma3, Ma5, Ma6), genes asociados a la giberelina (GA) (SbGA2ox1, SbGA3ox1, SbGA2ox7), los genes implicados en el control de la fecha de partida (SbZCN8)1,31 y la señalización de GA y la regulación de la altura de la planta (SbSLR11) se localizaron principalmente hacia los extremos distal y proximal de los cromosomas de interés (Fig. 2).
El análisis de los genes que albergan SNP mostró que se compartían más genes (18.785) entre los cruces Sb y BC1, con relativamente menos genes, es decir, 109, 230 y 291 eran privados para las tres líneas respectivas Sb1, SbxSh50 y SbxSh9 (Fig. 4) . El análisis de los procesos biológicos (BP) GO enriquecimiento asociado a los genes SbxSh mostró 33,693 y 5548 genes en el conjunto de datos del genoma de referencia de Sorghum bicolor y en el conjunto de genes híbridos SbxSh9 / SbxSh5 que se mapearon a los términos GO (ya sea directamente o a través de la herencia), respectivamente (Cuadro 2). Los términos más granulares incluyeron enriquecimiento en genes asociados a la organización de la pared celular de tipo vegetal (GO:0009664), desarrollo de raíces (GO:004836), proceso metabólico de polisacáridos de la pared celular (GO:0010383), proceso metabólico del glutatión (GO:0006749) , proceso catabólico de peróxido de hidrógeno (GO:0042744), morfogénesis de estructuras anatómicas (GO:0009653), respuesta al estrés oxidativo (GO:0006979), proceso catabólico de proteínas proteasómicas (GO:0010498), respuesta a compuestos que contienen oxígeno (GO:1901700 ), generación de metabolitos precursores y energía (GO:0006091), traducción (GO:0006412), vía de señalización mediada por hormonas (GO:0009755), respuesta a estímulos abióticos (GO:0009628), transporte mediado por vesículas (GO:0,016,192 ), biogénesis del complejo de ribonucleoproteínas (GO:0022613), organización de subunidades complejas que contienen proteínas (GO:0043933), transporte intracelular (GO:0046907), ensamblaje de componentes celulares (GO:0022607), localización de proteínas (GO:0008104), organización de orgánulos (GO:0006996), transporte de compuestos de nitrógeno (GO:0071705), transporte de sustancias orgánicas (GO:0071702), proceso metabólico de moléculas pequeñas (GO:0044281), regulación de la transcripción, plantilla de ADN (GO:0006355), que contiene nucleobase proceso metabólico compuesto (GO:0006139), regulación positiva de la traducción (GO:0045727).
Número de genes compartidos y privados entre Sb1 (IESV 99,091 DL) y dos RIL perennes hermanos (SbxSh9 y SbxSh50) derivados de SbxSh retrocruzado (2 dosis parentales recurrentes: Tx623*2/Gypsum 9; BC1) a S. bicolor74.
Para el término GO de desarrollo de raíces (GO:004836) mapearon 34 genes: GeneID:8080001, GeneID:8064680, GeneID:8054879, GeneID:8075742, GeneID:8059541, GeneID:8078975, GeneID:8081609, GeneID:8055737, GeneID:8055874, GeneID:8063307, GeneID:8058361, GeneID:8084663, GeneID:8064471, GeneID:8079326, GeneID:8079141, GeneID:8060669, GeneID:8063006, GeneID:8060622, GeneID:8080905, GeneID:8077286, Gen ID:8060000, GeneID: 8058075, GeneID:8074440, GeneID:8082391, GeneID:8065800, GeneID:8080849, GeneID:8085583, GeneID:8071472, GeneID:8084890, GeneID:8072111, GeneID:8063311, GeneID:8054193, GeneID: 8059201, Gene ID: 8082281.
El desarrollo de sorgo perenne iniciado en 2015 en nuestro programa de mejoramiento; Los rendimientos morfoagronómicos anteriores de los materiales evaluados se informaron en nuestros trabajos anteriores14. Según nuestra experiencia y la literatura disponible19, la producción de rizomas es la condición sine qua non para que las líneas SbxSh permanezcan perennes en climas templados como las condiciones predominantes en nuestras estaciones experimentales italianas14. Uno de los hallazgos más interesantes de estudios recientes es la ausencia de compensación negativa entre el desarrollo del rizoma y el rendimiento de semillas y el rendimiento de biomasa aérea. Se espera que esto permita el desarrollo de ideotipos de sorgo de doble propósito, grano y biomasa de alto rendimiento que expresen estructuras subterráneas perennes14,19. Las líneas perennes Sorghum bicolor × S. halepense mostraron competitividad en relación con los híbridos comerciales en términos de producción de biomasa aérea y rendimiento de grano; sin embargo, la mayoría de las líneas derivadas de retrocruzamientos mostraron un aspecto general de la planta27 y rasgos de domesticación tales como alto rendimiento de semillas, grandes cariopsis, resistencia al desmoronamiento de semillas, inflorescencia compacta y fuerza del tallo más cercana a S. bicolor que a otros cruces14,20.
El rendimiento de grano se correlacionó significativamente con la madurez, el rendimiento de masa seca, la fracción de masa seca del material fresco, el número de tallos, el desarrollo de rizomas, la hemicelulosa y la supervivencia de los rizomas, pero se observaron coeficientes de correlación importantes para la madurez, el número de tallos y el desarrollo de rizomas. Las características que mostraron una correlación significativa de media a alta32 con el rendimiento de masa seca aérea incluyeron la altura de la planta, la fracción de masa seca del material fresco, el número de tallos y la fibra detergente neutra.
En este trabajo, completamos el primer análisis de resecuenciación del genoma completo de un panel único compuesto por poblaciones de Sorghum bicolor y S. bicolor × S. halepense. Nuestra resecuenciación se centró en líneas consanguíneas recombinantes (RIL) de S. bicolor × S. halepense en lugar de S. halepense per se y esto puede explicarse por nuestro esfuerzo por alinear el experimento de resecuenciación con nuestro programa de mejoramiento para desarrollar cultivares de sorgo perenne14. Los RIL de SbxSh se desarrollaron a través del cruzamiento y la selección para minimizar el arrastre de enlace asociado con S. halepense, por ejemplo, rotura de semillas, granos de tamaño pequeño, macollas y rizomas excesivos, y forma y compacidad de inflorescencia indeseables en nuestras poblaciones de mejoramiento. Por lo tanto, se esperaba que la resecuenciación explicara las contribuciones de las líneas parentales a la composición genómica de las combinaciones de híbridos perennes. El uso de parientes silvestres en las introgresiones genéticas generalmente va acompañado de un arrastre de ligamiento asociado con la introducción de rasgos desfavorables junto con los favorables33, y esto requiere un esfuerzo de mejoramiento significativo y lento para recuperar el fenotipo domesticado, particularmente cuando el producto primario es el grano18,34. Este experimento de resecuenciación es importante en el fitomejoramiento, particularmente en el sorgo. Se utilizarán variantes novedosas para el descubrimiento de genes, mientras que una gran cantidad de polimorfismos de alta calidad descubiertos se aprovecharán en el proceso de selección genómica, estudios de asociación del genoma completo y selección asistida por marcadores. Como estas son poblaciones fundadoras de todo nuestro programa de mejoramiento, no se puede dejar de enfatizar la oportunidad que ofrece la resecuenciación35, particularmente en términos de mayores predicciones genómicas y precisión de mapeo de loci de rasgos cuantitativos. Además, hasta ahora no se han desarrollado plataformas de genotipado, por ejemplo, matrices, chips como los que se usan en otras especies de cultivos, por ejemplo, tomate, papa o pimiento, en el sorgo para el genotipado de alto rendimiento de las características del sorgo, particularmente aquellas asociadas con la perennidad26. Por lo tanto, el objetivo principal de este trabajo fue desarrollar un gran repertorio de información genómica y conjuntos de datos de polimorfismos que pueden usarse para el descubrimiento y validación de genes, y como fuente de marcadores para construir plataformas de genotipado con fines de mejoramiento aplicado.
En este trabajo se produjeron un total de 21.700 millones y 3,25 billones de lecturas y bases clean paired-end, respectivamente. En general, el 94,54 % del total de lecturas limpias mostró un valor de calidad Q20 ≥ 94,54 %; dicho valor de calidad superó el 96% cuando se calculó en S. bicolor y S. bicolor × S. halepense por separado, lo que indica una alta calidad de los datos. La tasa de mapeo, es decir, el porcentaje de cobertura de la referencia por lecturas de las muestras de sorgo varió del 89,15 % al 95,18 % con una media del 92 %, mientras que el porcentaje de lecturas mapeadas varió del 82,65 % al 99,92 % con una media del 99,40 %. , lo que indica una alta precisión de secuenciación y la ausencia de ADN contaminante. La profundidad de mapeo efectiva fue entre 23,17X y 34,38X, que fue en gran medida suficiente (Zheng et al. 2011) para alinear la mayoría de las secuencias de las muestras objetivo y atestiguó la alta calidad del genoma de referencia. La profundidad de mapeo obtenida en este estudio fue mayor que en la mayoría de los experimentos de mapeo anteriores que mostraron valores alrededor de 10X36,37 y abarcaron la longitud completa del genoma de referencia en un patrón homogéneo en todas las accesiones. La tasa de mapeo y el porcentaje de lecturas mapeadas realizadas en este estudio fueron mejores que los informados en trabajos anteriores y confirman la alta calidad de la secuencia de referencia utilizada. Por ejemplo, Gramazio et al.26 informaron una tasa de mapeo promedio de 85,4% con un rango de 76,9 a 88,7%. Por otro lado, en algunas especies modelo, las tasas promedio de lecturas no mapeadas fueron más altas, por ejemplo, 3–5 % en tomate38,39 y 10–15 % en arroz40,41. Las diferencias en los experimentos de mapeo se pueden atribuir a una variedad de factores que incluyen diferencias en: (1) el progreso del ensamblaje de la secuencia, (2) los niveles de elementos repetitivos, (3) la divergencia genética entre las muestras secuenciadas y el genoma de referencia, y (4) los niveles de polimorfismos variantes38,41.
Las poblaciones de Sorghum bicolor × S. halepense y S. bicolor mostraron lecturas mapeadas comparables, bases mapeadas, profundidad de secuenciación después del mapeo, mientras que Sorghum bicolor × S. halepense mostró una tasa de cobertura porcentual más alta estadísticamente significativa (94.87a vs. 91.62b), pero menor porcentaje de bases de aciertos (81.96a frente a 77.58b) y porcentaje único de lecturas de aciertos (82.39a frente a 78.31b). Dado que Sorghum bicolor (Sb) y S. bicolor × S. halepense mostraron una calidad de lecturas limpias comparable (Q20 y Q30) y el número de lecturas y bases limpias, la mayor tasa de cobertura observada en S. bicolor × S. halepense puede atribuirse a a las tasas más bajas de lecturas asignadas de forma única y, por lo tanto, a la existencia de lecturas asignadas a múltiples loci genómicos de referencia con un bajo nivel de similitud de secuencia con la secuencia objetivo. La existencia de lecturas multimapeadas en S. bicolor × S. halepense puede explicarse porque esta población produce un número estadísticamente mayor de indeles cortos, inserciones de fragmentos largos (al menos 50 pb), CNV, regulaciones al alza y a la baja de CNV que S. bicolor42. Se esperaba un nivel relativamente más bajo de similitud de secuencia entre la secuencia de referencia de S. bicolor y S. bicolor × S. halepense en virtud de la distancia genética que existía entre los dos genomas (Fig. 1) derivada principalmente de S. halepense. Bajo tales circunstancias, varios autores39 señalaron la necesidad de secuenciar y ensamblar varios genomas de referencia de parientes silvestres de cultivos para evitar análisis de resecuenciación sesgados y mejorar la tasa de lecturas mapeadas de manera única. Sin embargo, dado que la dinámica de las ganancias y pérdidas de genes durante la evolución de las plantas y particularmente durante la hibridación interploide entre S. bicolor y S. halepense aún no se comprende por completo, otras razones pueden explicar la mayor cobertura del genoma de S. bicolor × S. halepense.
La población SbxSh mostró un mayor grado de heterocigosidad (Cuadro 1), lo cual es consistente con análisis genéticos previos34, y puede explicarse por la historia genética de S. bicolor que sufrió el cuello de botella de la domesticación, lo que resultó en un estrechamiento de la base genética con con respecto a las especies silvestres, mientras que la naturaleza tetraploide de S. halepense y su progenie puede haber jugado un papel importante en la heterocigosidad observada en la población SbxSh; la fijación de alelos requiere un mayor número de generaciones en poliploides, y la heterocigosidad disminuye lentamente incluso en presencia de ciclos repetidos de autofecundación43. Además, las lecturas de resecuenciación del genoma completo se alinearon con el genoma de referencia de S. bicolor13; la alineación de secuencias de un SbxSh alotetraploide a un genoma diploide puede resultar en una sobreestimación de loci heterocigóticos debido a la alineación de homeólogos. En S. halepense, los homeólogos derivados de ortólogos en los genomas de sus ancestros (S. bicolor y S. propinquum) se conservan, pero después de la hibridación de S. bicolor × S. halepense, se vuelve difícil predecir el destino de dichos homeólogos entre generaciones debido a diferentes posibilidades de apareamiento cromosómico y distribución independiente en la meiosis44. No obstante, se espera que al menos algunos de los pares de cromosomas homeólogos puedan mantenerse y contribuir a aumentar la heterocigosidad de las líneas endogámicas recombinantes.
Nuestro estudio ha identificado un gran conjunto de polimorfismos, que consta de 665 378 447 de variantes de alta calidad que incluyen SNP, indels, SV y CNV; Los SNP representaron el 85,22% de todas las variantes, lo que está de acuerdo con trabajos previos26. La identificación de más SNP en el presente panel de sorgo representa una buena oportunidad de mejoramiento, ya que estos marcadores son más baratos y fáciles de automatizar para el genotipado de alto rendimiento con respecto a otros marcadores45,46. La resecuenciación del genoma completo completada en este trabajo es, por lo tanto, el punto de partida para desarrollar una gran cantidad de marcadores no solo en S. bicolor sino también en parientes silvestres del sorgo como Sorghum halepense, para los cuales la falta de dicha información ralentizó su uso en programas de mejoramiento39,47. Hay historias de éxito sobre la oportunidad de aprovechar variantes de polimorfismos de parientes silvestres de cultivos, por ejemplo, en soja37,48, arroz41, tomate39,49 y berenjena26. En nuestro estudio, la población de SbxSh produjo más variantes que la población de Sb, lo que confirmó los hallazgos de trabajos anteriores que mostraban que los parientes silvestres de cultivos producen más variaciones en relación con las variedades locales o las accesiones cultivadas. Nuestro estudio destaca, por lo tanto, la posibilidad de una introgresión controlada de la variación de S. halepense para ampliar la base genética de S. bicolor; introgresiones similares se lograron en otros cultivos, por ejemplo, arroz, tomate y trigo50. Según nuestro leal saber y entender, nuestro estudio representa el primer esfuerzo para aprovechar la valiosa gran cantidad de diversidad genética de S. halepense mediante la resecuenciación del genoma completo. Se evaluaron paneles similares en estudios previos, pero se basaron en plataformas de genotipado por secuenciación que mostraron limitaciones técnicas particularmente asociadas con una profundidad de secuenciación muy baja (~ 1.5X) y una cobertura deficiente8,34. Ejemplos de tales investigaciones previas basadas en genotipado por secuenciación incluyen estudios de desequilibrio de ligamiento sobre biomasa y características relacionadas con la biomasa en sorgo8, características antioxidantes en sorgo34 y arquitectura de la planta de sorgo51. Además, Habyarimana y López utilizaron SNP de genotipado por secuenciación para llevar a cabo la predicción y selección genómica en sorgo52,53. Se espera que la información producida en este trabajo y las variantes identificadas de S. halepense aceleren la introgresión de la perenneidad y otras regiones genómicas útiles de esta especie productora de rizomas18 para desarrollar cultivares de sorgo superiores que cumplan con las prácticas agroecológicas y resistentes al clima. También se identificó una gran cantidad de polimorfismos de alta confianza en la población de S. bicolor y se aprovecharán para el genotipado de alto rendimiento en especies de sorgo cultivadas o silvestres utilizando plataformas de genotipado de alto rendimiento, por ejemplo, matrices o chips. En este trabajo, los genotipos se llamaron individualmente para cada muestra para todas las variantes pero, para los SNP, también realizamos un genotipado conjunto entre muestras para producir un conjunto de llamadas VCF de múltiples muestras para futuras investigaciones. El conjunto de llamadas VCF de múltiples muestras produjo archivos vcf de 33 y 6 Mb de SNP e indels, respectivamente, con una buena cobertura y profundidad de secuenciación. Estas matrices se utilizarán para proporcionar más información y mejorar estudios previos, particularmente en domesticación, predicciones genómicas, estudios de asociación del genoma completo y filogenética26.
Las estadísticas Fst, que es una métrica de la estructura de la población, confirmaron estudios previos8 que mostraban que Sb y SbxSh forman dos poblaciones distintas. Además, la diferenciación entre las dos poblaciones está respaldada por el mayor número de variantes observadas en la población SbxSh, en particular SNP, SNP de gran efecto, CNV, SV, indels y mutaciones frameshift. La Fst lograda en este trabajo fue superior o comparable a reportes previos8,54; las discrepancias Fst observadas pueden atribuirse a diferencias en el número de marcadores utilizados, la diversidad genética de la población y en los enfoques de muestreo implementados en estos trabajos. Se identificó un valor atípico (SbxSh102) que está genéticamente más cerca de la población de S. bicolor. El SbxSh102 consiste en dos dosis del padre recurrente S. bicolor (Tx623) en el cruce controlado S. bicolor × S. halepense (Gypsum 9) y este RIL perenne es de interés genético y de mejoramiento futuro en el desarrollo de ideotipos perennes de Sorghum bicolor.
Nuestro estudio produjo genes y variantes con una mayor densidad que cubría mejor la longitud completa de los cromosomas individuales que en trabajos anteriores52,55,56. La densidad de genes, SNPs e indeles mostró un patrón de distribución cromosómico similar, aumentando desde la región pericentromérica hacia los telómeros. Se espera que este mejor patrón de distribución de variantes impulse el descubrimiento de nuevos genes y marcadores importantes. En trabajos anteriores8,31,57, se descubrieron SNP significativos y los genes candidatos se localizaron principalmente hacia los extremos distal y proximal de los cromosomas de interés. Nuestro trabajo de resecuenciación del genoma completo produjo una alta densidad de variantes de marcadores que cubren el genoma completo y, por lo tanto, ofrece la oportunidad de descubrir nuevas variantes de marcadores principales y genes en las regiones pericentroméricas que actualmente muestran poca información. El análisis de los procesos biológicos de enriquecimiento GO asociado a los genes SbxSh mostró 5.548 genes privados que se mapearon a los términos GO importantes; 34 de estos genes asignados al desarrollo del sistema de raíces (GO:0022622), dos (GeneID:8054879 y GeneID:8072111) de los cuales se informó que gobiernan las propiedades de las raíces58,59. Los estudios realizados en Arabidopsis thaliana demostraron que ROOT PRIMORDIUM DEFECTUOSO 1 (RPD1; GeneID:8054879) es necesario para el mantenimiento de la proliferación celular activa y juega un papel fundamental en el desarrollo de las raíces58, mientras que el RETARDO EN EL CRECIMIENTO DE RAÍCES (RRG, GeneID:8072111) El gen se expresa predominantemente en el meristema de la raíz y codifica una proteína localizada en la mitocondria que se requiere para la división celular en el meristemo de la raíz (Xiaojing Zhou et al.). Las variantes y los análisis funcionales realizados en este trabajo mostraron que la extracción de los genes y las variantes privadas de SbxSh puede proporcionar información sobre los factores genéticos que controlan las características de las plantas capaces de impulsar la mejora genética del sorgo, en particular el rasgo de perenneidad que cumple con las prácticas agroecológicas, la agricultura sostenible y el clima. cambiar la resiliencia.
Este trabajo generó el primer mapa del genoma completo de SNP, indels, SV y CNV en un panel de sorgo que incluye el genoma de S. halepense, que puede usarse como marco para futuras investigaciones en genómica funcional y mejoramiento asistido por genoma. El sorgo es el quinto cereal económicamente más importante del mundo y es un alimento básico, especialmente en los trópicos semiáridos de África y Asia, y se utiliza en todo el mundo para diversos fines, incluidos alimentos, piensos, forraje, alcohol de calidad comercial, así como como primera, segunda y segunda y biocombustibles de tercera generación. Las variantes (SNP, indels, SV y CNV) descubiertas en este documento impulsarán los estudios genómicos, por ejemplo, predicción y selección genómica, análisis de enlace y desequilibrio de enlace, base molecular de varias características de plantas de sorgo, todo lo cual puede generar avances para lograr ganancias genéticas significativas en cultivo de sorgo.
Ciento setenta y dos genotipos de sorgo, incluidas 19 líneas endogámicas avanzadas de S. bicolor × S. halepense (SbxSh) y 153 líneas de S. bicolor (Sb), fueron resecuenciadas con el genoma completo. Los genotipos de sorgo bicolor estaban compuestos por razas locales tropicales, líneas mejoradas de las mismas y líneas de mejoramiento de zonas templadas. Las líneas SbxSh estaban en diferentes niveles (F4–F7) de descendencia filial generada a partir de cruces que involucraban genotipos anuales/perennes (A/P) y retrocruzamientos A/P con padres anuales recurrentes (A*2/P; BC1), perennes/perennes (P/P) y combinaciones híbridas anuales/perennes//perennes (A/P//P) seguidas de ciclos de selección. Las líneas parentales anuales fueron diploides estándar (2n = 20), tetraploides inducidas (2n = 40), citoplasmáticas masculinas estériles y genéticas masculinas estériles endogámicas. Las líneas parentales perennes consistieron en una planta de S. halepense y líneas tetraploides derivadas de la hibridación controlada de plantas de sorgo tetraploides inducidas con S. halepense. Estas poblaciones fueron descritas en Habyarimana et al.8,14. Las técnicas de hibridación interespecífica entre Sb y Sh fueron descritas recientemente por Hodnett et al.60.
El ADN genómico total se extrajo de plántulas de sorgo etioladas de 10 días de edad cultivadas en condiciones estándar de invernadero, de acuerdo con el método del bromuro de cetiltrimetilamonio61, con modificaciones menores. La integridad del ADN se evaluó con electroforesis en gel de agarosa, la calidad del ADN se evaluó mediante las proporciones de 260/280 y 260/230 nm del espectrofotómetro NanoDrop ND-1000 (NanoDrop Technologies, Wilmington, Delaware, EE. UU.) y la concentración se midió con un fluorómetro Qubit® 2.0 (Thermo Fisher Scientific, Waltham, MA, EE. UU.). Se enviaron muestras de ADN de alta calidad a BGI Tech Solutions (Hongkong) Co., Limited para la construcción de bibliotecas y la resecuenciación del genoma completo. Se prepararon bibliotecas de extremos emparejados con un tamaño de inserción de aproximadamente 300 pb y se secuenciaron en la plataforma Illumina DNB-SEQ PE150 de acuerdo con el protocolo del proveedor, lo que produjo una profundidad de secuenciación de 20X, lo que resultó en 15 G de bases por muestra. Las secuencias del genoma de referencia del sorgo BTx623 se descargaron del sitio web de fitozomas del Joint Genome Institute62,63.
Las secuencias sin procesar se procesaron con el filtro SOAPnuke interno del proveedor para obtener lecturas limpias descartando lecturas con más del 50 % de secuencia adaptadora, lecturas de baja calidad en las que más del 50 % de las bases muestran una puntuación de Phred inferior a 20 y lecturas con un 2 % o más bases "N", es decir, cualquier base. Luego, las lecturas procesadas se mapearon al genoma de referencia de S. bicolor (BTx623) versión 3.1.113 utilizando Burrows-Wheeler Aligner (BWA)64. BWA mostró un buen rendimiento al alinear secuencias de nucleótidos relativamente cortas con una referencia larga y producir resultados precisos y rápidos con tasas de error bajas. Proporciona una configuración de parámetros flexible y el resultado de la alineación se presenta en formato SAM65. Picard-tools (v1.118)66 se utiliza para clasificar los archivos SAM por coordenadas, convertirlos en archivos BAM y marcar las lecturas duplicadas para que las descarte Genome Analysis Toolkit (GATK) durante los análisis posteriores. Los archivos BAM se procesaron aún más para la reparación de información de pareja, la adición de información de grupo de lectura y el etiquetado de lecturas duplicadas; dichos archivos BAM posprocesados se utilizan fácilmente para la detección de variaciones. GATK67 detecta polimorfismos de nucleótido único (SNP) y pequeñas inserciones/eliminaciones (InDels), BreakDancer68 se usa para llamadas de variantes de estructura (SV) y SOAPcnv69 para llamadas de variantes de número de copia (CNV). Los genotipos se llamaron individualmente para cada muestra para todas las variantes pero, además, para los SNP, también realizamos un genotipado conjunto entre muestras para producir un conjunto de llamadas VCF (Variant Call Format) de múltiples muestras para futuras predicciones genómicas y análisis de desequilibrio de ligamiento.
Para detectar SNP de alta calidad, primero calculamos la probabilidad del genotipo de cada muestra utilizando SOAPsnp70 y el genotipo con la mayor probabilidad se seleccionó como el genotipo del individuo secuenciado en el locus específico. A continuación, seleccionamos un locus polimórfico frente a la secuencia de referencia utilizando la secuencia de consenso diana y, en función de los datos de resecuenciación de 172 muestras, determinamos los SNP ubicados en sitios efectivos con calidad suficiente, es decir, que respondían a los siguientes criterios: 3 ≤ profundidad ≤ 50 , con profundidad calculada usando datos de cada individuo, sitios mapeables promedio < 1.5 y una calidad promedio para el nuevo alelo > 20. Los SNP se localizaron en sitios de empalme, codones de inicio, codones de terminación, regiones codificantes y no codificantes y otros ácidos nucleicos. moléculas basadas en modelos de genes anotados en la base de datos de referencia del genoma de S. bicolor13.
Para identificar la indel corta, asignamos las lecturas de extremos emparejados a la secuencia de referencia, lo que permitió espacios de hasta 10 pb, fusionamos estos pares redundantes y se extrajeron los espacios que eran compatibles con al menos tres lecturas de extremos emparejados no redundantes. Se identificó una indel potencial cuando el número de lecturas sin espacios que cruzaron una indel potencial no fue más del doble que el de las lecturas con espacios. Los indels finales de alta calidad incluyeron solo aquellos identificados en ambos hilos por lecturas de extremos emparejados.
La variación de estructura (SV) incluye la eliminación, inserción, duplicación, inversión y transposición de fragmentos largos (al menos 50 pb) en el genoma. En este estudio, utilizamos SOAPsv64 para detectar SV según el principio de paired-end64, es decir, que una de las dos lecturas de paired-end debe alinearse con la cadena directa, mientras que la otra debe alinearse con la cadena negativa (inversa). . Además, la distancia entre las dos lecturas después de la alineación debe ser del tamaño del inserto, y los pares de dos lecturas deben tener una orientación normal y un lapso adecuado cuando se alinean con el genoma. Si la orientación o el intervalo de los pares de dos lecturas no es consistente con las expectativas de alineación, pueden estar involucradas variaciones estructurales en esa región. Las alineaciones anormales de extremos emparejados se analizan mediante agrupamiento y el resultado se compara con tipos de SV predefinidos. Se requiere un umbral de 3 lecturas finales emparejadas anormales para respaldar la existencia de SV, mientras que las SV que fueron compatibles con al menos seis lecturas finales emparejadas se consideraron de alta calidad y se identificaron como las SV finales en este trabajo.
Detectamos las CNV mediante los siguientes pasos: (i) las secuencias de ADN se separaron en fragmentos según la profundidad de cada base a partir de los resultados de la alineación; (ii) calculamos el valor P para cada fragmento para estimar su probabilidad de ser una CNV; y (iii) los fragmentos que pasaron los criterios (longitud de fragmento superior a 2 kb, valor P ≤ 0,35, profundidad media inferior a 0,5 o superior a 2,0) se mantuvieron como CNV. El valor P se calculó como la probabilidad de cada profundidad observada (d) bajo la distribución de un conjunto de datos distribuidos de Poisson simulados cuyo valor esperado (E(d)) es igual a la profundidad media observada. Si d < E(d), el valor P = P(x ≤ d) × 2, de lo contrario, el valor P = P(x ≥ d) × 2. La credibilidad de una CNV es inversamente proporcional al valor P.
Se llevó a cabo una ontología génica y una investigación genética molecular en profundidad en una línea Sb de doble propósito derivada de una variedad tropical mejorada (IESV 99091 DL) y dos RIL perennes hermanas (SbxSh9 y SbxSh50) derivadas de SbxSh retrocruzadas que crecen en rizomas (2 dosis parentales: Tx623*2/Gypsum 9; BC1) a progenitor Sb recurrente con esterilidad masculina citoplásmica, a más de seis generaciones de autofecundación. Se seleccionó un conjunto de 12 484 genes que contenían polimorfismos de un solo nucleótido identificados en los dos RIL SbxSh hermanos pero no en IESV 99091 DL como el conjunto de genes candidatos asociado con S. halepense (Fig. 4). Estos genes se mapearon en la ontología de genes (GO)26 para evaluar sus características, utilizando las herramientas de análisis de la lista de genes PANTHER71. PANTHER toma un conjunto de genes y compara la frecuencia de los términos GO en el conjunto de muestra con la frecuencia del mismo conjunto de términos GO en el conjunto de referencia para identificar los términos que están sobrerrepresentados o subrepresentados en el conjunto de muestra. En este trabajo, realizamos la prueba de sobrerrepresentación PANTHER utilizando la base de datos GO Ontology https://doi.org/10.5281/zenodo.4735677 publicada el 1 de mayo de 2021. La lista de referencia consistió en Sorghum bicolor (todos los genes en la base de datos), mientras que la anotación Los conjuntos de datos fueron "Función molecular GO completa", "Proceso biológico GO completo" y "Componente celular GO completo", que son los conjuntos de datos con las anotaciones GO completas y actualizadas. Se utilizó la prueba binomial72 y se aplicó la corrección de Bonferroni para tener en cuenta múltiples pruebas (una para cada vía o cada término de ontología) al mismo tiempo. Sólo los resultados corregidos por Bonferroni con un nivel de probabilidad P < 0,05 se consideraron significativos, es decir, cuanto menor sea el valor de P, menor será la probabilidad de que el resultado obtenido pueda explicarse mediante una distribución aleatoria.
La información de Habyarimana et al.8 se utilizó en este trabajo para el mapeo físico genómico de SNP relacionados con la biomasa, genes candidatos y genes que se sabe que sustentan la altura y la madurez de la planta de sorgo. Las transcripciones de genes conocidos se identificaron en phytozome63. En su trabajo de Habyarimana et al.8, el estudio de asociación del genoma completo se realizó utilizando el paquete de genética estadística Genome Association and Prediction Integrated Tool (GAPIT)73 dentro del entorno R74. Además, se usaron dos algoritmos GWAS de múltiples locus para identificar loci de rasgos cuantitativos significativos (QTL) para los rasgos relacionados con la biomasa: BLINK (información bayesiana y desequilibrio de enlace iterativamente anidado Keyway)75,76 y SUPER (asentamiento de MLM bajo progresivamente Relación exclusiva) 77.
Las inferencias estadísticas para separar medias, por ejemplo, estadísticas de secuenciación, se llevaron a cabo usando análisis de varianza y la prueba Tukey HSD al nivel de significancia del 5%. La diversidad genética se evaluó mediante el Fstatistic y el análisis de coordenadas principales78. Las inferencias estadísticas y la visualización de datos se realizaron con el software R74.
Los conjuntos de datos generados y/o analizados durante el estudio actual no están disponibles públicamente debido al uso planificado en un futuro cercano, pero están disponibles del primer autor correspondiente a pedido razonable.
Ordonio, R., Ito, Y., Morinaka, Y., Sazuka, T. & Matsuoka, M. Capítulo Cinco: Mejoramiento molecular de sorgo bicolor, un nuevo cultivo energético. En Revista Internacional de Biología Celular y Molecular vol. 321 (ed. Jeon, KW) 221–257 (Academic Press, 2016).
Google Académico
Plan estratégico de ICRISAT para 2020: Desarrollo inclusivo orientado al mercado para pequeños agricultores en las tierras secas tropicales. (Instituto Internacional de Investigación de Cultivos para los Trópicos Semiáridos, 2010).
Alfieri, M., Balconi, C., Cabassi, G., Habyarimana, E. & Redaelli, R. Actividad antioxidante en un conjunto de razas locales y líneas de mejoramiento de sorgo. Maydica 62, 1–7 (2017).
Google Académico
Bekele, EK, Nosworthy, MG, Tyler, RT & Henry, CJ Capacidad antioxidante y contenido total de fenoles de refrigerios de garbanzo y sorgo de expansión directa. J. Proceso de Alimentos. Preservar 45, e15439 (2021).
CAS Google Académico
Dykes, L. Compuestos fenólicos en granos de cereales y sus beneficios para la salud. Cereal Food World 52, 105–111 (2007).
CAS Google Académico
Dicko, MH, Gruppen, H., Traore, AS, van Berkel, WJH & Voragen, AGJ Evaluación del efecto de la germinación sobre compuestos fenólicos y actividades antioxidantes en variedades de Sorgo. J. Agric. Química alimentaria 53, 2581–2588 (2005).
CAS PubMed Google Académico
Wu, Y. et al. La presencia de taninos en los granos de sorgo está condicionada por diferentes alelos naturales de Tannin1. proc. nacional Academia ciencia EE. UU. 109, 10281–10286 (2012).
ANUNCIOS CAS PubMed PubMed Central Google Académico
Habyarimana, E., De Franceschi, P., Ercisli, S., Baloch, FS y Dall'Agata, M. Estudio de asociación de todo el genoma para rasgos relacionados con la biomasa en un panel de poblaciones de Sorghum bicolor y S. bicolor × S. halepense . Frente. ciencia de las plantas 11, 1796 (2020).
Google Académico
Awika, JM & Rooney, LW Fitoquímicos del sorgo y su impacto potencial en la salud humana. Fitoquímica 65, 1199–1221 (2004).
CAS PubMed Google Académico
Dykes, L. Sorghum fitoquímicos y su impacto potencial en la salud humana. Métodos Mol. Biol. 1931, 121–140 (2019).
CAS PubMed Google Académico
Przybylska-Balcerek, A., Frankowski, J. & Stuper-Szablewska, K. Compuestos bioactivos en sorgo. Euro. Alimentos Res. Tecnología 245, 1075–1080 (2019).
CAS Google Académico
Paterson, AH et al. El genoma del sorgo bicolor y la diversificación de las gramíneas. Naturaleza 457, 551–556 (2009).
ANUNCIOS CAS PubMed Google Académico
McCormick, RF y col. El genoma de referencia de Sorghum bicolor: ensamblaje mejorado, anotaciones de genes, un atlas de transcriptoma y firmas de organización del genoma. Planta J. 93, 338–354 (2018).
CAS PubMed Google Académico
Habyarimana, E. et al. Hacia un cultivo de sorgo de biomasa perenne: una investigación comparativa de los rendimientos de biomasa y la hibernación de las líneas Sorghum bicolor x S. halepense en relación con los ensayos a largo plazo de S. bicolor en el norte de Italia. Biomasa Bioenergía 111, 187–195 (2018).
Google Académico
Paterson, AH Genómica del Sorgo. En t. J. Genoma vegetal. 2008, 1–6 (2008).
Google Académico
Cox, TS et al. Cultivo de cultivos de cereales perennes. crítico Rev. Plant Sci. 21, 59–91 (2002).
Google Académico
Cox, TS et al. Avances en el mejoramiento de granos perennes. Cultivo Pasto Sci. 61, 513–521 (2010).
Google Académico
Cox, S., Nabukalu, P., Paterson, AH, Kong, W. y Nakasagga, S. Desarrollo de sorgo de grano perenne. Sostenibilidad 10, 172 (2018).
Google Académico
Piper, J. & Kulakow, P. Rendimiento de semillas y asignación de biomasa en Sorghum bicolor y F1 y generaciones retrocruzadas de híbridos S bicolor X S. halepense. Poder. J.Bot. 72, 468–474 (2011).
Google Académico
Nabukalu, P. & Cox, TS Respuesta a la selección en las etapas iniciales de un programa de mejoramiento de sorgo perenne. Euphytica 209, 103–111 (2016).
CAS Google Académico
Cox, S. et al. Alta proporción de híbridos diploides producidos por hibridación interespecífica de Sorgo diploide × tetraploide. Gineta. recurso Cultivo Evol. 65, 387–390 (2018).
CAS Google Académico
Dweikat, I. Un híbrido diploide, interespecífico y fértil de sorgo cultivado, Sorghum bicolor, y la maleza común johnsongrass Sorghum halepense. mol. Criar. 16, 93–101 (2005).
Google Académico
Batello, C. et al. Cultivos Perennes para la Seguridad ALIMENTARIA (FAO, 2014).
Google Académico
Hallam, A., Anderson, IC & Buxton, DR Análisis económico comparativo de cultivos perennes, anuales e intercalados para la producción de biomasa. Biomasa Bioenergía 21, 407–424 (2001).
Google Académico
Moore, KJ et al. Regeneración de paisajes agrícolas con cobertura vegetal perenne para la producción intensiva de cultivos. Agronomía 9, 458 (2019).
ADS CAS Google Académico
Gramazio, P. et al. La resecuenciación del genoma completo de siete accesiones de berenjena (Solanum melongena) y un pariente silvestre (S. incanum) proporciona nuevos conocimientos y herramientas de mejoramiento para la mejora de la berenjena. Frente. ciencia de las plantas 10, 1220 (2019).
PubMed PubMed Central Google Académico
CIRF e ICRISAT. Descriptores para sorgo [Sorghum bicolor (L.) Moench]. (Junta Internacional de Recursos Fitogenéticos, 1993).
Wright, S. La estructura genética de las poblaciones. Ana. Eugenio 15, 323–354 (1951).
MathSciNet CAS PubMed MATEMÁTICAS Google Académico
Wright, S. La interpretación de la estructura de la población por las estadísticas F con especial atención a los sistemas de apareamiento. Evolución 19, 395–420 (1965).
Google Académico
Zheng, L.-Y. et al. Patrones de variación genética de todo el genoma en sorgo dulce y en grano (Sorghum bicolor). Genoma Biol. 12, R114 (2011).
CAS PubMed PubMed Central Google Académico
Ordonio, RL et al. La deficiencia de giberelina induce pleiotrópicamente la flexión del culmo en el sorgo: una visión del mejoramiento del sorgo semienano. ciencia Rep. 4, 5287 (2014).
CAS PubMed PubMed Central Google Académico
Gomez, KA & Gomez, AA Procedimientos Estadísticos para la Investigación Agropecuaria 2da ed. (Wiley-Interscience, 1984).
Google Académico
Singh, M. & Kumar, S. Ampliación de la base genética de los cereales de grano. Springer India https://doi.org/10.1007/978-81-322-3613-9 (2016).
Artículo Google Académico
Habyarimana, E., Dall'Agata, M., De Franceschi, P. & Baloch, FS Mapeo de asociación de todo el genoma de la capacidad antioxidante total, fenoles, taninos y flavonoides en un panel de Sorghum bicolor y S. bicolor × S. poblaciones de halepense utilizando modelos multi-locus. PLoS ONE 14, e0225979 (2019).
CAS PubMed PubMed Central Google Académico
Pascual, L. et al. Potencial de una población MAGIC de tomate para descifrar el control genético de caracteres cuantitativos y detectar variantes causales en la era de la resecuenciación. Biotecnología vegetal. J. 13, 565–577 (2015).
CAS PubMed Google Académico
Guo, S. et al. El borrador del genoma de la sandía (Citrullus lanatus) y la resecuenciación de 20 accesiones diversas. Nat. Gineta. 45, 51–58 (2013).
CAS PubMed Google Académico
Zhou, Z. et al. La resecuenciación de 302 accesiones silvestres y cultivadas identifica genes relacionados con la domesticación y mejora de la soja. Nat. Biotecnología. 33, 408–414 (2015).
CAS PubMed Google Académico
Causse, M. et al. La resecuenciación del genoma completo en tomate revela variación asociada con eventos de introgresión y reproducción. Genoma BMC. 14, 791 (2013).
Google Académico
Aflitos, S. et al. Exploración de la variación genética en el clado del tomate (Solanum sección Lycopersicon) mediante la secuenciación del genoma completo. Planta J. 80, 136–148 (2014).
Académico de Google de PubMed
Subbaiyan, GK et al. Polimorfismos de ADN en todo el genoma en cultivos endogámicos de arroz índica de élite descubiertos mediante la secuenciación del genoma completo. Biotecnología vegetal. J. 10, 623–634 (2012).
CAS PubMed Google Académico
Xu, X. et al. La resecuenciación de 50 accesiones de arroz cultivado y silvestre produce marcadores para identificar genes agronómicamente importantes. Nat. Biotecnología. 30, 105–111 (2012).
CAS Google Académico
Deschamps-Francoeur, G., Simoneau, J. & Scott, MS Manejo de lecturas multiasignadas en RNA-seq. computar Estructura. Biotecnología. J. 18, 1569-1576 (2020).
CAS PubMed PubMed Central Google Académico
Kellogg, EA Historia evolutiva de las gramíneas1. Fisiol vegetal. 125, 1198–1205 (2001).
CAS PubMed PubMed Central Google Académico
Rakshit, S., Ganapathy, KN y Visarada, K. Citogenética del sorgo. crítico Rdo. ciencia de las plantas https://doi.org/10.1007/978-3-319-47789-3_3 (2016).
Artículo Google Académico
Kim, C. et al. Aplicación de genotipado mediante tecnología de secuenciación a una variedad de programas de mejoramiento de cultivos. ciencia de las plantas 242, 14–22 (2016).
CAS PubMed Google Académico
Yan, J. et al. Genotipado de SNP de alto rendimiento con el ensayo GoldenGate en maíz. mol. Criar. 25, 441–451 (2010).
ADS CAS Google Académico
Brozynska, M., Furtado, A. & Henry, RJ Genómica de parientes silvestres de cultivos: Ampliación del acervo genético para la mejora de cultivos. Biotecnología vegetal. J. 14, 1070–1085 (2016).
CAS PubMed Google Académico
Lam, H.-M. et al. La resecuenciación de 31 genomas de soja silvestre y cultivada identifica patrones de diversidad y selección genética. Nat. Gineta. 42, 1053–1059 (2010).
CAS PubMed Google Académico
Gao, L. et al. El pan-genoma del tomate descubre nuevos genes y un alelo raro que regula el sabor de la fruta. Nat. Gineta. 51, 1044–1051 (2019).
CAS PubMed Google Académico
Dempewolf, H. et al. Uso pasado y futuro de parientes silvestres en el mejoramiento de cultivos. Ciencia de cultivos 57, 1070–1082 (2017).
Google Académico
Kong, W. et al. Mapeo cuantitativo de rasgos de la arquitectura de la planta en dos poblaciones BC1F2 de Sorghum bicolor × S. halepense y comparaciones con otras dos poblaciones de sorgo. teor. aplicación Gineta. 134, 1185–1200 (2021).
CAS PubMed Google Académico
Habyarimana, E. & Lopez-Cruz, M. Selección genómica para la producción de antioxidantes en un panel de Sorghum bicolor y S. bicolor × S. halepense Lines. Genes 10, 841 (2019).
CAS PubMed Central Google Académico
Habyarimana, E., Lopez-Cruz, M. & Baloch, FS Selección genómica para índice óptimo con rendimiento de biomasa seca, fracción de masa seca de material fresco y altura de planta en biomasa de sorgo. Genes 11, 61 (2020).
CAS PubMed Central Google Académico
McClean, PE et al. Estructura de la población y diferenciación genética entre la colección central de frijol común (Phaseolus vulgaris L.) del USDA. Gineta. recurso Cultivo Evol. 59, 499–515 (2012).
Google Académico
Rhodes, DH et al. Estudio de asociación de todo el genoma de las concentraciones de polifenoles en grano en germoplasma global de sorgo [Sorghum bicolor (L.) Moench]. J. Agric. Química alimentaria 62, 10916–10927 (2014).
CAS PubMed Google Académico
Rhodes, D., Gadgil, P., Perumal, R., Tesso, T. & Herald, TJ Variación natural y estudio de asociación del genoma completo de antioxidantes en una colección diversa de sorgo. Química de cereales. J. 94, 190–198 (2017).
CAS Google Académico
Ordonio, R., Ito, Y., Morinaka, Y., Sazuka, T. & Matsuoka, M. Mejoramiento molecular de sorgo bicolor, un nuevo cultivo energético. En t. Rev. Padre. Mol celular. Biol. Rev. 321, 221–257 (2016).
CAS PubMed Google Académico
Konishi, M. & Sugiyama, M. Se requiere un nuevo gen familiar específico de plantas, ROOT PRIMORDIUM DEFECTIVE 1, para el mantenimiento de la proliferación celular activa. Fisiol vegetal. 140, 591–602 (2006).
CAS PubMed PubMed Central Google Académico
Zhou, X. et al. El gen de Arabidopsis RETARDED ROOT GROWTH codifica una proteína localizada en la mitocondria que se requiere para la división celular en el meristema de la raíz1[W]. Fisiol vegetal. 157, 1793–1804 (2011).
CAS PubMed PubMed Central Google Académico
Hodnett, GL, Ohadi, S., Pugh, NA, Bagavathiannan, MV y Rooney, WL La hibridación interespecífica de Sorghum bicolor x S. halepense está influenciada por la frecuencia de 2n gametos en S. bicolor. ciencia Rep. 9, 17901 (2019).
ADS PubMed PubMed Central Google Académico
Tiwari, KL, Jadhav, SK & Gupta, S. Técnica CTAB modificada para el aislamiento de ADN de algunas plantas medicinales. Res. J.Med. Planta 6, 65–73 (2012).
CAS Google Académico
Información sobre fitozomas: S. bicolor v3.1.1. https://phytozome-next.jgi.doe.gov/info/Sbicolor_v3_1_1.
Goodstein, DM et al. Fitozoma: una plataforma comparativa para la genómica de plantas verdes. Ácidos Nucleicos Res. 40, D1178–D1186 (2012).
CAS PubMed Google Académico
Li, H. & Durbin, R. Alineación de lectura corta rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática 25, 1754–1760 (2009).
CAS PubMed PubMed Central Google Académico
Formato SAM/BAM/CRAM. Análisis NGS https://learn.gencore.bio.nyu.edu/ngs-file-formats/sambam-format/ (2017).
Herramientas Picard: por Broad Institute. http://broadinstitute.github.io/picard/.
Li, H. et al. El formato de mapa/alineación de secuencias y SAMtools. Bioinformática 25, 2078–2079 (2009).
PubMed PubMed Central Google Académico
McKenna, A. et al. El kit de herramientas de análisis del genoma: un marco MapReduce para analizar datos de secuenciación de ADN de próxima generación. Genoma Res. 20, 1297–1303 (2010).
CAS PubMed PubMed Central Google Académico
Chen, K. et al. BreakDancer: un algoritmo para el mapeo de alta resolución de la variación estructural genómica. Nat. Métodos 6, 677–681 (2009).
CAS PubMed PubMed Central Google Académico
Li, R. et al. Detección de SNP para la resecuenciación masiva del genoma completo en paralelo. Genoma Res. 19, 1124-1132 (2009).
CAS PubMed PubMed Central Google Académico
Murugesan, S., Goldberg, EB, Dou, E. & Brown, WJ Identificación de diversos motivos de direccionamiento de gotas de lípidos en la familia PNPLA de triglicéridos lipasas. PLoS ONE 8, e64950 (2013).
ANUNCIOS CAS PubMed PubMed Central Google Académico
Mi, H., Muruganujan, A., Casagrande, JT & Thomas, PD Análisis de función génica a gran escala con el sistema de clasificación PANTHER. Nat. Protocolo 8, 1551–1566 (2013).
PubMed PubMed Central Google Académico
Tang, Y. et al. GAPIT Versión 2: Una herramienta integrada mejorada para la asociación y predicción genómica. Genoma vegetal https://doi.org/10.3835/plantgenome2015.11.0120 (2016).
Artículo PubMed Google Académico
Equipo, RC R: un lenguaje y entorno para la computación estadística (2014).
Liu, L. et al. Investigación original: un estudio de asociación de todo el genoma de casos y controles identifica modificadores genéticos de la hemoglobina fetal en la enfermedad de células falciformes. Exp. Biol. Medicina. 241, 706–718 (2016).
CAS Google Académico
Huang, Y.-F., Polonia, JA, Wight, CP, Jackson, EW y Tinker, NA Uso de genotipado por secuenciación (GBS) para el descubrimiento genómico en avena cultivada. PLoS ONE 9, e102448 (2014).
ADS PubMed PubMed Central Google Académico
Wang, Q., Tian, F., Pan, Y., Buckler, ES y Zhang, Z. Un método SUPER poderoso para el estudio de asociación amplia del genoma. PLoS ONE 9, e107684 (2014).
ADS PubMed PubMed Central Google Académico
Gower, JC Algunas propiedades de distancia de la raíz latente y los métodos vectoriales utilizados en el análisis multivariante. Biometrika 53, 325–338 (1966).
MathSciNet MATEMÁTICAS Google Académico
Descargar referencias
Instituto Internacional de Investigación de Cultivos para los Trópicos Semiáridos, Patancheru, 502 324, Telangana, India
Ephrem Habyarimana & Sunita Gorthy
Facultad de Ciencias y Tecnologías Agrícolas, Universidad de Ciencia y Tecnología de Sivas, Sivas, Turquía
Faheem S. Baloch
Departamento de Horticultura, Facultad de Agricultura, Universidad Ataturk, 25240, Erzurum, Turquía
Sezai Ercisli
Departamento de Biotecnología, Universidad Nacional de Chonnam, Chonnam, República de Corea
Gyuhwa Chung
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
EH: conceptualización, metodología, investigación, curación de datos, software, supervisión, administración de proyectos, adquisición de fondos, redacción: preparación del borrador original, visualización. SG, EH, SE, FSB y GC: análisis y redacción formales: revisión y edición. Todos los autores han leído y aceptado la versión publicada del manuscrito.
Correspondencia a Ephrem Habyarimana o Gyuhwa Chung.
Los autores declaran no tener conflictos de intereses.
Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Habyarimana, E., Gorthy, S., Baloch, FS et al. La resecuenciación del genoma completo de las líneas Sorghum bicolor y S. bicolor × S. halepense proporciona nuevos conocimientos para mejorar las características agroecológicas de las plantas. Informe científico 12, 5556 (2022). https://doi.org/10.1038/s41598-022-09433-0
Descargar cita
Recibido: 02 noviembre 2021
Aceptado: 23 de marzo de 2022
Publicado: 01 abril 2022
DOI: https://doi.org/10.1038/s41598-022-09433-0
Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:
Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.
Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt
Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.