Si bien el número de genes codificantes (aquellos que generan proteínas) de la especie humana se ha reducido progresivamente en los últimos años, se ha postulado que la dimensión del proteoma, aquel que ejecuta las instrucciones empaquetadas en el genoma, podría alcanzar cifras mayores. Esta diversidad de proteínas se ha posicionado como una de las principales fuentes de complejidad en mamíferos, entre ellos, la especie humana.

Esta teoría podría tener fecha de caducidad, según un estudio encabezado por el investigador Michael Tress del grupo de Alfonso Valencia en el Centro Nacional de Investigaciones Oncológicas (CNIO) y que publica hoyla revista Trends in Biochemical Sciences (TIBS). Según los investigadores, la mayoría de los genes producen, en contra de lo que se pensaba, una única proteína dominante. Estos resultados llaman a un replanteamientosobre el origen y la fuente de la innovación biológica, que originó la aparición de los primates hace 50 millones de años o el desarrollo del cerebro humano, por ejemplo.

"El menguante genoma humano". Así es como describía Valencia hace más de dos años las continuas rectificaciones de las anotaciones del genoma humano. Entonces, su equipo contabilizaba el número de genesen aproximadamente 19.000. ¿Se puede construir algo tan complejo como el ser humano con un número de genes tan reducido?

Muchos investigadores escépticos ante esta pregunta han dirigido en los últimos años sus miradas hacia el proteoma como posible fuente de innovación biológica. Cada gen puede producir hasta decenas o cientos deARNs, que se generan por combinaciones de distintas porciones de un gen a través del splicing alternativo. Posteriormente, los ARNs son traducidos a proteínas. De ahí que el splicing alternativo se haya contemplado comouna fuente importante de diversidad proteica y biológica.

En esta cadena de la vida, del gen al ARN y del ARN a la proteína, a los autores del trabajo les llamó la atención la inmensa diferencia entre el número de ARNs o transcritos, del orden de cientos de miles en humanos,y el de proteínas, cuantificadas experimentalmente en poco más que 12.000. "El problema es que el enorme número de transcritos nos ha hecho suponer que hay un número mayor de proteínas, pero nunca se hademostrado experimentalmente la presencia de todas ellas en las células", explica Michael Tress, investigador principal del proyecto.

"¿Un gen, una proteína, o un gen, varias proteínas?", se preguntan los investigadores en las páginas de la revista. Para responder a esta pregunta han hecho un metaanálisis exhaustivo en el que han compilado datos deocho experimentos a gran escala y bases de datos sobre proteínas o péptidos humanos. Los datos analizados procedían de una amplia colección de tejidos, líneas celulares y estadios de desarrollo distintos

Los resultados muestran que mientras que hay muchas variantes alternativas de ARNs procedentes de un solo gen, solamente unos pocos genes (246, poco más del 1% del genoma humano) presentan evidencias claras de producir más de una proteína. "La inmensa mayoría de los genes generan una sola proteína dominante, lo que nos dice que el splicing alternativo no es fundamental para la complejidad del proteoma”, explica Tress. 

Los autores explican que cuando el splicing alternativo tiene lugar genera proteínas muy conservadas, con orígenes evolutivos que pueden llegar a tener hasta más de 500 millones de años, y con cambios muy sutiles en suestructura y función.

Estas observaciones pueden tener importantes implicaciones en biomedicina, especialmente en la predicción de los efectos de las distintas variantes genéticas o mutaciones en el organismo. El equipo sugiere que solamente serán perjudiciales aquellas mutaciones en el ADN que tengan consecuencias sobre las proteínas dominantes.

A pesar de las pocas evidencias de splicing alternativo en células sanas, la situación se presenta muy distinta en patologías como el cáncer. En este caso, el splicing alternativo juega un papel fundamental para la generaciónde nuevas formas de proteínas con funciones aberrantes y que comprometen la viabilidad del organismo.

Los investigadores se preguntan ahora por la existencia de todos aquellos ARNs para los que no se detectan proteínas y, por lo tanto, para los que no hay, de momento, una función biológica definida. ¿Podría tratarse deinformación perdida?, ¿inútil? ¿Desempeñan nuevas funciones de regulación todavía por descubrir? ¿De dónde emerge la complejidad del proteoma si no es del splicing alternativo? Por ahora son preguntas sin respuesta a las que se enfrenta la ciencia.