Ciertas regiones del genoma humano que se suponía contenían material evolutivo sobrante -denominado «ADN» basura- en realidad pueden contener importantes pistas que podrían ser de gran utilidad para ayudar a los científicos a comprender los procesos celulares.
IBM anunció que sus investigadores han descubierto numerosos patrones de ADN que son compartidos por ciertas áreas del genoma humano que se pensaba que tenían poca o ninguna influencia en su función y las áreas que sí la tienen.
Tal como se informa en el documento Proceedings of the National Academy of Sciences (PNAS), ciertas regiones del genoma humano que se suponía contenían en gran medida material evolutivo sobrante (denominado «ADN» basura) en realidad pueden contener importantes pistas que podrían ser de gran utilidad para ayudar a los científicos a comprender los procesos celulares. Los investigadores de IBM han descubierto que estas regiones contienen numerosos cortos «motivos» de ADN, o fragmentos de secuencias repetidas, que también están presentes en partes del genoma que dan lugar a las proteínas.
En caso de lograr ser verificado experimentalmente, el descubrimiento sugiere la existencia de una conexión potencial entre estas partes codificadas y no codificadas del genoma humano que podría tener un profundo impacto en la investigación genómica y dar lugar a importantes conocimientos sobre el funcionamiento de las células.
«Nuestro objetivo es aplicar técnicas de computación avanzada para analizar el funcionamiento de los procesos y sistemas, en este caso, la función del genoma humano», comentó Ajay Royyuru, responsable del Centro de Biología Computacional de IBM Research. «Utilizando estas herramientas, pudimos arrojar nueva luz sobre partes del ADN que tradicionalmente se consideraban sin ninguna finalidad específica. Creemos que la aplicación innovadora de la tecnología puede llevar a un mayor discernimiento en las ciencias de vida en general».
El equipo de IBM usó una herramienta matemática llamada descubrimiento de patrones (comúnmente utilizada para extraer información útil en repositorios de datos muy grandes en aplicaciones tanto de negocios como científicas), para filtrar una cantidad de letras estimada en seis mil millones en las regiones no codificadas del genoma humana y buscar fragmentos de secuencias repetidas o motivos.
Entre los millones de motivos descubiertos, el equipo identificó aproximadamente 128.000 que también se producen en la región codificada del genoma y que están significativamente sobre-representados en los genes involucrados en procesos biológicos específicos tales como comunicación celular, regulación de la trascripción, transporte y otros. De hecho, las copias de uno o más de estos motivos pueden encontrarse en más del 90% de todas las secuencias conocidas del genoma humano, así como en algunos genes de otros animales donde se asocian con procesos biológicos similares.
Enlaces de interés:
www.research.ibm.com