El código del genoma humano por fin está completo

(Por Gabrielle Hartley, University of Connecticut) Cuando el Proyecto Genoma Humano anunció que había completado el primer genoma humano en 2003, fue un logro trascendental: por primera vez se descifró el código del ADN de la vida humana. Pero había un inconveniente, y es que no se consiguió reunir toda la información del genoma. Existían lagunas, regiones sin rellenar, a menudo repetitivas, que resultaban demasiado confusas para unirlas.

Gracias a los avances en la tecnología para manejar estas secuencias repetitivas, los científicos finalmente llenaron esos vacíos en mayo de 2021, y el primer genoma humano completo ha sido publicado oficialmente el 31 de marzo de 2022.

Soy una bióloga experta en genética que estudia las secuencias repetitivas de ADN y cómo dan forma a los genomas a lo largo de la historia evolutiva. Formé parte del equipo que ayudó a caracterizar las secuencias repetitivas que faltaban. Y ahora, con un genoma humano completo, esas regiones repetitivas se están explorando por primera vez en su totalidad.

Las piezas del puzzle que faltaban

El botánico alemán Hans Winkler acuñó la palabra “genoma” en 1920, combinando la palabra “gen” con el sufijo “-ome” (en inglés es genome), que significa “conjunto completo”, para describir la secuencia completa de ADN que contiene cada célula. Los investigadores siguen utilizando esta palabra un siglo después para referirse al material genético que compone un organismo.

Una forma de describir el aspecto de un genoma es compararlo con un libro de consulta. En esta analogía, un genoma es una antología que contiene las instrucciones del ADN para la vida. Se compone de una amplia gama de nucleótidos (letras) que se empaquetan en cromosomas (capítulos). Cada cromosoma contiene genes (párrafos) que son regiones de ADN que codifican las proteínas específicas que permiten el funcionamiento de un organismo.

Diagrama de un cromosoma que desvela el ADN enrollado, los genes y los nucleótidos que lo componen
El material genético está formado por ADN empaquetado estrechamente en cromosomas. Solo algunas regiones del genoma contienen genes que codifican proteínas. VectorMine / iStock via Getty Images Plus

Aunque todo organismo vivo tiene un genoma, su tamaño varía de una especie a otra. Un elefante utiliza la misma forma de información genética que la hierba que come y las bacterias de su intestino. Pero no hay dos genomas exactamente iguales. Algunos son cortos, como el genoma de la bacteria que habita en los insectos Nasuia deltocephalinicola, con solo 137 genes en 112 000 nucleótidos. Otros, como los 149 000 millones de nucleótidos de la planta con flores Paris japonica, son tan largos que resulta difícil hacerse una idea de cuántos genes contienen.

No obstante, los genes, tal y como se entienden tradicionalmente como tramos de ADN que codifican proteínas, constituyen solo una pequeña parte del genoma de un organismo. De hecho, suponen menos del 2 % del ADN humano.

El genoma humano contiene aproximadamente 3 000 millones de nucleótidos y algo menos de 20 000 genes que codifican proteínas, lo que representa un 1 % de la longitud total del genoma.

El 99 % restante son secuencias de ADN no codificantes que no producen proteínas. Algunas son componentes reguladores que funcionan como una centralita para controlar el funcionamiento de otros genes. Otras son pseudogenes o reliquias genómicas que han perdido su capacidad de funcionamiento.

Y más de la mitad del genoma humano es repetitivo, con múltiples copias de secuencias casi idénticas.

¿Qué es el ADN repetitivo?

La forma más sencilla de ADN repetitivo son los bloques de ADN que se repiten una y otra vez en tándem, llamados satélites. Aunque la cantidad de ADN satélite que tiene un determinado genoma varía de una persona a otra, suelen agruparse hacia los extremos de los cromosomas en regiones llamadas telómeros. Estas regiones protegen a los cromosomas de la degradación durante la replicación del ADN. También se encuentran en los centrómeros de los cromosomas, una región que ayuda a mantener intacta la información genética cuando las células se dividen.

Los investigadores aún no conocen bien todas las funciones del ADN satélite. Pero como forma patrones únicos en cada persona, los biólogos forenses y los genealogistas utilizan esta huella genómica para cotejar muestras de la escena del crimen y rastrear la ascendencia. Más de 50 trastornos genéticos están relacionados con variaciones en el ADN satélite, incluida la enfermedad de Huntington.

46 cromosomas humanos coloreados en azul con telómeros blancos contra una pantalla negra
El ADN satélite tiende a agruparse hacia los extremos de los cromosomas en sus telómeros. Aquí, 46 cromosomas humanos están coloreados en azul, con telómeros blancos. NIH Image Gallery / Flickr, CC BY-NC

Otro tipo abundante de ADN repetitivo son los elementos transponibles o secuencias que pueden desplazarse por el genoma.

Algunos científicos los han descrito como ADN “egoísta” porque pueden insertarse en cualquier lugar del genoma, sin importar las consecuencias. A medida que el genoma humano evolucionó, muchas secuencias transponibles recogieron mutaciones, reprimiendo su capacidad de moverse para evitar interrupciones perjudiciales. Pero es probable que algunas sigan moviéndose. Por ejemplo, las inserciones de elementos transponibles están relacionadas con varios casos de hemofilia A, un trastorno hemorrágico genético.

Pero los elementos transponibles no son solo disruptivos. Pueden tener funciones reguladoras que ayudan a controlar la expresión de otras secuencias de ADN. Cuando están concentrados en los centrómeros, también pueden ayudar a mantener la integridad de los genes fundamentales para la supervivencia celular.

Asimismo, pueden contribuir a la evolución. Los investigadores han descubierto recientemente que la inserción de un elemento transponible en un gen importante para el desarrollo podría ser la razón por la que algunos primates, incluidos los humanos, ya no tienen cola. Los reordenamientos cromosómicos debidos a elementos transponibles están incluso vinculados a la génesis de nuevas especies como los gibones del sudeste asiático y los wallabies de Australia.

Completar el rompecabezas genómico

Hasta hace poco, muchas de estas complejas regiones podían compararse con la cara oculta de la luna: se sabía que existían, pero no se veían.

Cuando el Proyecto Genoma Humano se puso en marcha por primera vez en 1990, las limitaciones tecnológicas impedían descubrir por completo las regiones repetitivas del genoma. La tecnología de secuenciación disponible solo podía leer unos 500 nucleótidos a la vez, y estos fragmentos cortos tenían que superponerse unos a otros para recrear la secuencia completa. Los investigadores utilizaron estos segmentos superpuestos para identificar los siguientes nucleótidos de la secuencia, ampliando gradualmente el ensamblaje del genoma de a un fragmento por vez.

Estas regiones repetitivas de lagunas eran como armar un rompecabezas de 1 000 piezas de un cielo nublado: cuando todas las piezas son iguales, ¿cómo saber dónde empieza una nube y dónde acaba otra? Con tramos casi idénticos que se solapan en muchos puntos, la secuenciación completa del genoma por partes se hizo inviable. En la primera iteración del genoma humano quedaron ocultos millones de nucleótidos.

Desde entonces, los parches de secuencias han ido rellenando poco a poco las lagunas del genoma humano. Y en 2021, el Consorcio Telómero a Telómero (T2T), un consorcio internacional de científicos que trabajan para completar un ensamblaje del genoma humano de extremo a extremo, anunció que todas las lagunas restantes fueron finalmente llenadas.

Con la finalización del primer genoma humano, los investigadores se proponen ahora capturar toda la diversidad de la humanidad.

Esto ha sido posible gracias a la mejora de la tecnología de secuenciación, capaz de leer secuencias más largas de miles de nucleótidos. Con más información para situar las secuencias repetitivas dentro de un panorama más amplio, resultó más fácil identificar su lugar adecuado en el genoma. Como si se simplificara un rompecabezas de 1 000 piezas a un rompecabezas de 100 piezas, las secuencias de lectura larga hicieron posible ensamblar grandes regiones repetitivas por primera vez.

Gracias a la creciente potencia de la tecnología de secuenciación de ADN de lectura larga, los genetistas están en condiciones de explorar una nueva era de la genómica, desentrañando por primera vez complejas secuencias repetitivas en poblaciones y especies. Y un genoma humano completo y sin lagunas constituye un recurso inestimable para que los investigadores estudien las regiones repetitivas que conforman la estructura y la variación genéticas, la evolución de las especies y la salud humana.

Pero un genoma completo no lo recoge todo. Se siguen realizando esfuerzos para crear diversas referencias genómicas que representen plenamente la población humana y la vida en la Tierra. Con referencias genómicas más completas, “telómero a telómero”, la comprensión de los científicos de la materia oscura repetitiva del ADN será más clara.

Gabrielle Hartley, PhD Candidate in Molecular and Cell Biology, University of Connecticut

Este artículo fue publicado originalmente en The Conversation. Lea el original.

The Conversation

Caledonian lanza las primeras residencias St. Regis de Marriott en España (su apertura está prevista para 2026)

Caledonian, promotora, constructora e inmobiliaria líder en el segmento del lujo en España, con más de 26 años de experiencia en la construcción y desarrollo de propiedades Premium sostenibles e inteligentes, presenta su último y más ambicioso proyecto: St. Regis, The Residences, Casares - Costa del Sol, cuya apertura está prevista para 2026, y que marca un hito importante en la historia de Caledonian, ya que debuta con las primeras residencias St. Regis independientes en Europa y la primera de España, tras el acuerdo firmado con Marriott International.

El mercado de la moda en Arabia Saudí alcanzó los 30.000 millones de dólares en 2023 (y proyecta alcanzar los 42.000 miillones para 2028)

La Comisión de Moda de Arabia Saudí, una de las 11 comisiones sectoriales del Ministerio de Cultura, ha presentado esta semana en Londres el informe anual “El estado del sector de la moda en Arabia Saudí 2024”. El estudio ofrece datos clave sobre el crecimiento acelerado de la industria de la moda en el Reino, destacando su relevancia tanto en el contexto regional como global.

The District 2024, en el primer plano del Real Estate europeo y con un impacto económico de 27 millones de euros para Barcelona

Hoy arranca The District 2024, la mayor cumbre del Real Estate en Europa diseñada por y para el capital, que tendrá lugar en Barcelona hasta este viernes, 27 de septiembre. En su edición más internacional, la cumbre será el escaparte donde se anticiparán las macrotendencias inmobiliarias de 2025 y se examinará lo que ha sido el primer semestre del año en curso para el sector.

KFC se convierte en la tercera marca de comida rápida en España (y espera duplicar su facturación en 2024, superando los 400 millones de euros respecto a 2019)

Ésta es la primera vez que una marca que ofrece una alternativa distinta a las opciones clásicas supera a opciones más tradicionales como las pizzas en España, alcanzando un 6,4% de cuota de gasto en el entorno de las principales cadenas de comida rápida, según los últimos datos proporcionados por el Panel Crest de Circana.

El número de empresas en clusters aumenta un 30% en 5 años, alcanzando las 3.000 por primera vez

El número de empresas que forman parte de los clusters en Cataluña ha crecido un 30% en los últimos 5 años y llega por primera a las 3.000 empresas. Así lo ha dado conocer hoy el consejero de Empresa y Trabajo, Miquel Sàmper, en el marco del Comité Consultivo del programa Catalunya Clústers impulsado desde la agencia por la competitividad de la empresa (ACCIÓ) del Departamento de Empresa y Trabajo.

Blackstone dicta sentencia en The District 2024: centros de datos, logística, hoteles y living, los activos con más proyección

El día de ayer ha abierto sus puertas The District 2024, el mayor encuentro inmobiliario europeo diseñado por y para el capital, que se celebra en Barcelona hasta este viernes 27. Durante la primera jornada, la cumbre ha recibido a líderes globales del Real Estate, que han compartido se punto de vista sobre el estado del sector desde una perspectiva macroeconómica.

SEUR lanza Singular by SEUR, un marketplace para apoyar a las pymes de alimentos gourmet

SEUR, líder en transporte urgente en España, ha lanzado Singular by SEUR (es.singular.shop), una innovadora plataforma que nace para apoyar a una parte fundamental de la economía española, las pymes. La compañía trabaja desde sus inicios de forma muy cercana con los emprendedores, empresas jóvenes y familiares de todo el país, ayudándoles a crecer y a llegar a más clientes en toda España y el mundo gracias a su red internacional con Geopost.

¿Puede el Inter Miami de Messi clasificarse para el Mundial de Clubes 2025? (cómo sigue después del empate y cuántas fechas le quedan al campeonato en USA)

(Por Diego Cánepa) El fenómeno del fútbol trasciende fronteras, y en Miami, donde la cultura anglolatina florece, la pasión por el deporte rey se siente con intensidad. Con Lionel Messi como figura estelar, el Inter Miami se encuentra en la senda de la gloria, con la posibilidad de clasificarse para el Mundial de Clubes 2025. Este artículo explora las oportunidades y desafíos que enfrenta el equipo en su camino hacia este prestigioso certamen, destacando la relevancia cultural y emocional que tiene para la comunidad local.