En 2003, después de casi $ 3 mil millones en fondos y 13 años de ardua investigación, los científicos del Proyecto Genoma Humano (HGP) anunciaron que finalmente habían mapeado la primera secuencia del genoma humano. Este fue un avance trascendental en la ciencia que revolucionaría la genómica. Sin embargo, el borrador inicial y las actualizaciones de la secuencia del genoma humano que siguieron no estaban completos al 100%. Pero ahora, los científicos del Consorcio Telomere-to-Telomere (T2T) afirman que han abordado el 8% restante del genoma humano que faltaba.
El Consorcio Telomere-to-Telomere (T2T) ha terminado la primera secuencia verdaderamente completa de 3055 millones de pares de bases (pb) de un genoma humano, lo que representa la mayor mejora en el genoma humano de referencia desde su lanzamiento inicial, escribieron los científicos en un artículo publicado en el servidor de preimpresión bioRxiv , lo que significa que aún no se ha revisado por pares.
El primer genoma verdaderamente completo de un vertebrado
El genoma es la suma de todas las secuencias de ADN y ADN mitocondrial (ADNmt) en la célula. Contiene todas las instrucciones que necesita un ser vivo para sobrevivir y replicarse, formadas por bloques o bases químicas (G, A, T y C), cuyo orden codifica la información biológica.
En organismos diploides, como los humanos, se considera que el tamaño del genoma es el número total de bases en una copia de su ADN nuclear. Los humanos y otros mamíferos contienen copias duplicadas de casi todo su ADN. Por ejemplo, tenemos pares de cromosomas, con un cromosoma de cada par heredado de cada padre. Pero los científicos solo están interesados en secuenciar la suma de las bases de una copia de cada par de cromosomas. El genoma real de una persona tiene un tamaño de aproximadamente seis mil millones de bases, pero una única copia representativa del genoma humano tiene un tamaño de aproximadamente tres mil millones de bases.
Debido a que el genoma humano es tan grande, sus bases no se pueden leer de principio a fin en un solo paso. Lo que hicieron los científicos de HGP para secuenciar el genoma fue primero descomponer el ADN en pedazos más pequeños, y luego someter cada pedazo a varias reacciones químicas que permitieron deducir la identidad y el orden de sus bases. Estos fragmentos y piezas se volvieron a unir para deducir la secuencia del genoma inicial.
Aunque la tecnología de secuenciación del genoma ha avanzado mucho desde que el HGP anunció el primer borrador del genoma humano en 2001, nunca se logró una secuencia completa del genoma completo. Faltaba alrededor del 8% del genoma, lo que corresponde a áreas donde las secuencias de ADN se componen de patrones repetitivos largos. Algunos de estos patrones repetitivos, como los que se encuentran en los centrómeros de los cromosomas (el nudo que une los cromosomas), desempeñan funciones biológicas importantes, pero la tecnología estándar no ha podido decodificarlos correctamente.
Usando una nueva tecnología revolucionaria, los científicos afiliados a T2T ahora afirman que han llenado estos vacíos.
Solo está tratando de profundizar en esta incógnita final del genoma humano, dijo a STAT News Karen Miga, investigadora de la Universidad de California en Santa Cruz, quien codirigió el consorcio internacional. Simplemente nunca se ha hecho antes y la razón por la que no se ha hecho antes es porque es difícil.
Según Miga y sus colegas, el avance del genoma fue posible gracias a las nuevas tecnologías de secuenciación de ADN desarrolladas por Pacific Biosciences en California y Oxford Nanopore en el Reino Unido. Estas tecnologías no cortan el ADN en pedazos diminutos para su posterior ensamblaje, lo que puede dar lugar a errores. En cambio, la tecnología Oxford Nanopore pasa la molécula de ADN a través de un agujero nanoscópico, lo que da como resultado una secuencia larga. Mientras tanto, los láseres desarrollados por Pacific Biosciences leen la misma secuencia de ADN una y otra vez, lo que hace que la lectura sea mucho más precisa que la tecnología anterior.
Ambas tecnologías se complementaron para revelar las partes faltantes del genoma que han estado eludiendo a los científicos durante casi dos décadas. Según TNT, el número de bases de ADN se ha incrementado de 2920 millones a 3050 millones, lo que supone una mejora del 4,5 %. Sin embargo, el número de genes solo aumentó en un 0,4%, a 19,1969, eso se debe a que la gran mayoría de las secuencias de ADN no codifican proteínas, sino que regulan la expresión y la actividad de estos genes.
El ensamblaje completo de telómero a telómero de un genoma humano marca una nueva era de la genómica en la que ninguna región del genoma está fuera de alcance. Las actualizaciones anteriores del genoma de referencia humano han sido incrementales y el alto costo de cambiar a un nuevo ensamblaje ha superado las ganancias marginales para muchos investigadores. Por el contrario, el ensamblaje T2T-CHM13 que se presenta aquí incluye cinco brazos cromosómicos completamente nuevos y es la mayor adición individual de contenido nuevo al genoma humano en los últimos 20 años, escribieron los investigadores.
Este 8% del genoma no se ha pasado por alto por su poca importancia, sino por limitaciones tecnológicas. La secuenciación de lectura larga de alta precisión finalmente ha eliminado esta barrera tecnológica, permitiendo estudios integrales de la variación genómica en todo el genoma humano. Dichos estudios requerirán necesariamente un genoma de referencia humano completo y preciso, lo que en última instancia impulsará la adopción del ensamblaje T2T-CHM13 que se presenta aquí, agregaron.
El genoma que secuenciaron los investigadores no provino de una persona sino de una mola hidatiforme, una masa o crecimiento raro que se forma dentro de la matriz (útero) al comienzo de un embarazo. Este tejido se forma cuando el espermatozoide fertiliza un óvulo sin núcleo, por lo que contiene solo 23 cromosomas, como un gameto (espermatozoide u óvulo), en lugar de los 46 que se encuentran en el ADN de una célula humana. Estas celdas simplifican el esfuerzo computacional pero pueden constituir una limitación.
Descubriremos más una vez que el documento sea revisado por pares y analizado adecuadamente por la comunidad científica internacional. Si los hallazgos se mantienen firmes, pueden marcar una nueva era de la genómica en la que ningún rincón o grieta del ADN quede sin explorar.
"