Abril, 2022
Hace 21 años, los científicos dieron los primeros pasos para descifrar el genoma humano consiguiendo una primera versión parcial. Ahora un consorcio internacional publica la primera secuencia completa, sin huecos, del genoma humano, que desvela nuevos genes y arrojará luz sobre las enfermedades hereditarias y la propia evolución humana. En efecto: los avances tecnológicos han permitido a los investigadores secuenciar las grandes regiones de ADN repetitivo que no pudo describir el Proyecto Genoma Humano.
Un hito: la primera secuencia completa del genoma humano
Adeline Marcos
Hasta ahora todos los estudios en genómica se han basado y han utilizado de referencia la secuencia del genoma humano producida hace más de dos décadas y catalogada como GRCh38 del Proyecto del Genoma Humano. En aquel momento supuso todo un éxito y revolucionó la medicina, pero por limitaciones tecnológicas, algunas regiones genómicas quedaron sin resolver, en concreto un 8 % del total.
“La secuencia del genoma de hace 21 años acertó en la mayor parte (92 %), pero dejó fuera las regiones difíciles que eran altamente repetitivas”, explica Evan Eichler, investigador del departamento de Ciencias Genómicas de la Universidad de Washington (Estados Unidos) que participó en el primer borrador. Además, no se terminó ningún cromosoma de punta a punta, y persistían cientos de lagunas en todo el genoma.
Ahora el Consorcio Telomere-to-Telomere (T2T), del que Eichler es copresidente y que cuenta con la participación de más de 100 investigadores de decenas de centros de investigación internacionales, ha logrado el ensamblaje de referencia más completo hasta la fecha para cualquier mamífero. Catalogado como T2T-CHM13, representa un paso importante hacia modelos que representen a todos los humanos, lo que ayudará a mejorar la medicina personalizada, el análisis genético poblacional y la edición genómica.
“Este proyecto no ha sido posible hasta que la tecnología de secuenciación de fragmentos grandes de ADN no ha alcanzado un grado de calidad suficiente”, señala Alfonso Valencia, profesor ICREA, director de Ciencias de la Vida en el Centro Nacional de Supercomputación de Barcelona (BSC), científico independiente del proyecto.
Según el investigador, en el presente trabajo, financiado por el Instituto Nacional de Investigación del Genoma Humano (NHGRI, por sus siglas en inglés), se alcanza un 99 % de fiabilidad secuenciando fragmentos que pueden ser de hasta 200 MB de información genética, equivalentes a un cromosoma humano de principio a fin.
La importancia de la secuencia completa
El hito, que se recoge en seis estudios científicos publicados hoy en la revista Science, que se suman a otros artículos complementarios en varias otras revistas, supone la finalización, de telómero a telómero —los extremos de los cromosomas—, de todas las bases ordenadas y orientadas de cada cromosoma humano.
Para Eichler, coautor de varios de los trabajos, la secuencia proporciona “la primera visión completa de todos los genes, añadiendo unos 120 nuevos que codifican proteínas y que no habían sido caracterizados anteriormente”.
Pero también se ofrece, por primera vez, la visión completa de los centrómeros —las partes del genoma importantes para la segregación—, y “los brazos cortos acrocéntricos de los cromosomas 13, 14, 15 y 21, donde residen los genes de ADN ribosómico que son importantes para la producción de proteínas de una célula”, concreta.
Los científicos disponen ahora de una secuencia sin huecos de los cerca de 3 000 millones de bases (o ‘letras’) de nuestro ADN, una información fundamental para comprender todo el espectro de la variación genómica humana, así como las contribuciones genéticas a determinadas enfermedades.
El análisis de la última versión de la secuencia del genoma contribuirá de manera significativa al conocimiento de los cromosomas, incluyendo mapas más precisos de cinco brazos cromosómicos, lo que abrirá nuevas líneas de investigación. Esto ayudará a responder a preguntas de biología básica sobre cómo los cromosomas se segregan y dividen adecuadamente.
Un paso más para entender la evolución humana
El consorcio T2T utilizó la nueva secuencia como referencia para descubrir más de dos millones de variantes adicionales en el genoma humano. Estos estudios proporcionan así información más precisa sobre las variantes genómicas dentro de 622 genes de importancia médica.
“La generación de una secuencia del genoma humano verdaderamente completa representa un logro científico increíble, ya que proporciona la primera visión exhaustiva de nuestra huella de ADN”, destaca Eric Green, director del NHGRI, “y esta información fundamental reforzará los esfuerzos en curso para comprender todos los matices funcionales del genoma humano, lo que a su vez potenciará los estudios genéticos de las enfermedades humanas”.
Además, un genoma completo mejorará la localización y el descubrimiento de variables genéticas y, al hacerlo, “mejorará nuestra capacidad para mapear enfermedades complejas”, añade Eichler.
De hecho, la principal aplicación será, por primera vez, la caracterización de genes y regiones del genoma hasta ahora inaccesibles. Proporcionará también nuevos conocimientos funcionales sobre, por ejemplo, la segregación de los cromosomas y la división de las células.
Por otra parte, como algunos de los genes importantes para la evolución humana se encuentran en regiones donde había lagunas, en principio mejorará la comprensión de cómo evolucionamos como especie con la caracterización de estas regiones.
Los resultados apuntan a patrones más complejos de variación en los genes que pueden haber contribuido a crear la especie humana, y podrían explicar nuestra rápida evolución. Por ejemplo, revela que algunos genes asociados a cerebros más grandes son muy variables, explica Eichler.
Entender las variaciones del ADN
La secuencia del genoma humano será de este modo especialmente valiosa para los estudios que pretenden establecer visiones completas de la variación genómica humana, o de cómo difiere el ADN de las personas. Estos conocimientos son vitales para comprender las contribuciones genéticas a determinadas enfermedades y para utilizar la secuencia del genoma como parte rutinaria de la atención clínica en el futuro.
“Me sigue sorprendiendo la cantidad de variación que existe entre los humanos en estas regiones más difíciles del genoma. Su tasa de diversidad es mucho más alta, mientras que gran parte del genoma es prácticamente idéntico entre dos humanos. Esas regiones son la excepción”, apunta Eichler. “El hecho de que contengan genes importantes para la adaptación debe significar que esta variabilidad sigue siendo relevante”.
Alfonso Valencia aclara que esta nueva versión “ya ha permitido localizar mutaciones y cambios asociados a condiciones y enfermedades que hasta ahora no conocíamos. Es una información particularmente relevante en el caso de enfermedades neurológicas relacionadas con duplicaciones de segmentos de cromosomas”, recalca.
Para los científicos esta gesta es un nuevo comienzo, y aunque queda mucho por descubrir, la nueva secuencia proporciona otro punto de referencia para observar y profundizar en la genética que subyace a nuestro ser completo.
▪▪▪
Una nueva era: el código del genoma humano se ha descifrado por completo
Gabrielle Hartley
Cuando el Proyecto Genoma Humano anunció que había completado el primer genoma humano en 2003, fue un logro trascendental: por primera vez se descifró el código del ADN de la vida humana. Pero había un inconveniente, y es que no se consiguió reunir toda la información del genoma. Existían lagunas, regiones sin rellenar, a menudo repetitivas, que resultaban demasiado confusas para unirlas.
Gracias a los avances en la tecnología para manejar estas secuencias repetitivas, los científicos finalmente llenaron esos vacíos en mayo de 2021, y el primer genoma humano completo ha sido publicado oficialmente el 31 de marzo de 2022.
Soy una bióloga experta en genética que estudia las secuencias repetitivas de ADN y cómo dan forma a los genomas a lo largo de la historia evolutiva. Formé parte del equipo que ayudó a caracterizar las secuencias repetitivas que faltaban. Y ahora, con un genoma humano completo, esas regiones repetitivas se están explorando por primera vez en su totalidad.
Las piezas del puzzle que faltaban
El botánico alemán Hans Winkler acuñó la palabra “genoma” en 1920, combinando la palabra “gen” con el sufijo “-ome” (en inglés es genome), que significa “conjunto completo”, para describir la secuencia completa de ADN que contiene cada célula. Los investigadores siguen utilizando esta palabra un siglo después para referirse al material genético que compone un organismo.
Una forma de describir el aspecto de un genoma es compararlo con un libro de consulta. En esta analogía, un genoma es una antología que contiene las instrucciones del ADN para la vida. Se compone de una amplia gama de nucleótidos (letras) que se empaquetan en cromosomas (capítulos). Cada cromosoma contiene genes (párrafos) que son regiones de ADN que codifican las proteínas específicas que permiten el funcionamiento de un organismo.
Aunque todo organismo vivo tiene un genoma, su tamaño varía de una especie a otra. Un elefante utiliza la misma forma de información genética que la hierba que come y las bacterias de su intestino. Pero no hay dos genomas exactamente iguales. Algunos son cortos, como el genoma de la bacteria que habita en los insectos Nasuia deltocephalinicola, con sólo 137 genes en 112 000 nucleótidos. Otros, como los 149 000 millones de nucleótidos de la planta con flores Paris japonica, son tan largos que resulta difícil hacerse una idea de cuántos genes contienen.
No obstante, los genes, tal y como se entienden tradicionalmente como tramos de ADN que codifican proteínas, constituyen solo una pequeña parte del genoma de un organismo. De hecho, suponen menos del 2 % del ADN humano.
El genoma humano contiene aproximadamente 3 000 millones de nucleótidos y algo menos de 20 000 genes que codifican proteínas, lo que representa un 1 % de la longitud total del genoma.
El 99 % restante son secuencias de ADN no codificantes que no producen proteínas. Algunas son componentes reguladores que funcionan como una centralita para controlar el funcionamiento de otros genes. Otras son pseudogenes o reliquias genómicas que han perdido su capacidad de funcionamiento.
Y más de la mitad del genoma humano es repetitivo, con múltiples copias de secuencias casi idénticas.
¿Qué es el ADN repetitivo?
La forma más sencilla de ADN repetitivo son los bloques de ADN que se repiten una y otra vez en tándem, llamados satélites. Aunque la cantidad de ADN satélite que tiene un determinado genoma varía de una persona a otra, suelen agruparse hacia los extremos de los cromosomas en regiones llamadas telómeros. Estas regiones protegen a los cromosomas de la degradación durante la replicación del ADN. También se encuentran en los centrómeros de los cromosomas, una región que ayuda a mantener intacta la información genética cuando las células se dividen.
Los investigadores aún no conocen bien todas las funciones del ADN satélite. Pero como forma patrones únicos en cada persona, los biólogos forenses y los genealogistas utilizan esta huella genómica para cotejar muestras de la escena del crimen y rastrear la ascendencia. Más de 50 trastornos genéticos están relacionados con variaciones en el ADN satélite, incluida la enfermedad de Huntington.
Otro tipo abundante de ADN repetitivo son los elementos transponibles o secuencias que pueden desplazarse por el genoma.
Algunos científicos los han descrito como ADN “egoísta” porque pueden insertarse en cualquier lugar del genoma, sin importar las consecuencias. A medida que el genoma humano evolucionó, muchas secuencias transponibles recogieron mutaciones, reprimiendo su capacidad de moverse para evitar interrupciones perjudiciales. Pero es probable que algunas sigan moviéndose. Por ejemplo, las inserciones de elementos transponibles están relacionadas con varios casos de hemofilia A, un trastorno hemorrágico genético.
Pero los elementos transponibles no son sólo disruptivos. Pueden tener funciones reguladoras que ayudan a controlar la expresión de otras secuencias de ADN. Cuando están concentrados en los centrómeros, también pueden ayudar a mantener la integridad de los genes fundamentales para la supervivencia celular.
Asimismo, pueden contribuir a la evolución. Los investigadores han descubierto recientemente que la inserción de un elemento transponible en un gen importante para el desarrollo podría ser la razón por la que algunos primates, incluidos los humanos, ya no tienen cola. Los reordenamientos cromosómicos debidos a elementos transponibles están incluso vinculados a la génesis de nuevas especies como los gibones del sudeste asiático y los wallabies de Australia.
Completar el rompecabezas genómico
Hasta hace poco, muchas de estas complejas regiones podían compararse con la cara oculta de la luna: se sabía que existían, pero no se veían.
Cuando el Proyecto Genoma Humano se puso en marcha por primera vez en 1990, las limitaciones tecnológicas impedían descubrir por completo las regiones repetitivas del genoma. La tecnología de secuenciación disponible sólo podía leer unos 500 nucleótidos a la vez, y estos fragmentos cortos tenían que superponerse unos a otros para recrear la secuencia completa. Los investigadores utilizaron estos segmentos superpuestos para identificar los siguientes nucleótidos de la secuencia, ampliando gradualmente el ensamblaje del genoma de a un fragmento por vez.
Estas regiones repetitivas de lagunas eran como armar un rompecabezas de 1 000 piezas de un cielo nublado: cuando todas las piezas son iguales, ¿cómo saber dónde empieza una nube y dónde acaba otra? Con tramos casi idénticos que se solapan en muchos puntos, la secuenciación completa del genoma por partes se hizo inviable. En la primera iteración del genoma humano quedaron ocultos millones de nucleótidos.
Desde entonces, los parches de secuencias han ido rellenando poco a poco las lagunas del genoma humano. Y en 2021, el Consorcio Telómero a Telómero (T2T), un consorcio internacional de científicos que trabajan para completar un ensamblaje del genoma humano de extremo a extremo, anunció que todas las lagunas restantes fueron finalmente llenadas.
Esto ha sido posible gracias a la mejora de la tecnología de secuenciación, capaz de leer secuencias más largas de miles de nucleótidos. Con más información para situar las secuencias repetitivas dentro de un panorama más amplio, resultó más fácil identificar su lugar adecuado en el genoma. Como si se simplificara un rompecabezas de 1 000 piezas a un rompecabezas de 100 piezas, las secuencias de lectura larga hicieron posible ensamblar grandes regiones repetitivas por primera vez.
Gracias a la creciente potencia de la tecnología de secuenciación de ADN de lectura larga, los genetistas están en condiciones de explorar una nueva era de la genómica, desentrañando por primera vez complejas secuencias repetitivas en poblaciones y especies. Y un genoma humano completo y sin lagunas constituye un recurso inestimable para que los investigadores estudien las regiones repetitivas que conforman la estructura y la variación genéticas, la evolución de las especies y la salud humana.
Pero un genoma completo no lo recoge todo. Se siguen realizando esfuerzos para crear diversas referencias genómicas que representen plenamente la población humana y la vida en la Tierra. Con referencias genómicas más completas, “telómero a telómero”, la comprensión de los científicos de la materia oscura repetitiva del ADN será más clara. (Artículo publicado originalmente en inglés.)