lunes, 28 de septiembre de 2015

¿Cómo clasificar tóxicos usando unidades de procesamiento gráfico (GPU)?

Muchas personas la mayoría de las veces no están al tanto de los productos que consumen día a día, y en particular no se percatan sobre como sustancias que pueden provenir de aditivos alimentarios, ingredientes de cosméticos, productos de limpieza, medicinas, pesticidas, entre otros, podrían llegar a ser tóxicas, llegando en el peor de los casos a ser letales

Es por esto que los productores cada vez más se preocupan por caracterizar de forma adecuada y oportuna lo que ofrecen a la comunidad. Sin embargo dicha tarea puede llegar a ser laboriosa y tomar mucho tiempo si sólo se toma como recurso las respectivas pruebas de laboratorio. Es por esto que métodos computacionales a gran escala pueden aportar su granito de arena en esta importante tarea para el bienestar de las personas.

Entonces se preguntarán, qué tienen que ver las unidades de procesamiento gráfico en todo esto?. La cantidad de moléculas nuevas que se caracterizan son gigantes, y están necesitan ser analizadas rápidamente antes de tomar alguna acción. Por ende desde el punto de vista computacional, este problema se le puede categorizar como un problema de Big Data, el cual es un paradigma actual en la cual se analizan grandes cantidades de información con metodologías no tradicionales, con el fin primordial de generar nuevo conocimiento que otorgue respuestas no contempladas previamente. Las unidades de procesamiento gráfico conocidas como GPU, fueron inicialmente creadas como un elemento complementario a las CPU, con el objetivo puntual de procesar gráficos y video, pero que debido a su arquitectura ha sido potencializado para su uso en computación de alto rendimiento, acelerando (dependiendo el caso) la capacidad de cálculo de cierto algoritmo.


Es por esto que NVIDIA, una de las principales compañías en el mundo en el campo de las GPU y computación en paralelo, lanzó en el 2015 el premio NVIDIA’s 2015 Global Impact Award, donde un grupo de investigadores del Instituto de Bioinformática de la Universidad Johaness Keppler en Linz, Austria, participaron y ganaron con la propuesta: DeepTox, una red neuronal profunda para la clasificación masiva de compuestos como potenciales tóxicos (Una explicación mas detallada de la herramienta se puede encontrar en el siguiente link: http://www.bioinf.jku.at/research/deeptox/).

El proyecto se basa en la clasificación de sustancias tóxicas utilizando nuevas metodologías de inteligencia artificial, usando solo como entrada la estructura de la molécula. Para acelerar dicho proceso, hardware especializado como las GPU permiten paralelizar protocolos de aprendizaje y clasificación, como los que hacen herramientas tan rutinarias como Google.

Para la clasificación, los científicos toman como referencia partes de la estructura molecular del compuesto a analizar, y estos son sometidos al clasificador para detectar patrones asociados con la aparición de ciertos eventos de toxicidad en el organismo (Figura 1). Para esto el software utiliza como base de entrenamiento miles de moléculas caracterizadas como tóxicas teniendo en cuenta la presencia o ausencia de ciertos elementos moleculares.
Figura 1.
Esquema de patrones que se determinan de las moléculas para su clasificación como tóxicos. 
A estos esquemas se les conoce como toxicóforos.
Ha sido tanto el éxito de la metodología desarrollada, que fue sometida al reto Tox 21 Data Challenge, donde fueron los ganadores con las mayores tasas de éxito en la predicción de toxicidad para nuevas moléculas. Este evento es organizado por la U.S. National Institute of Environmental Health Sciences, U.S. Environmental Protection Agency y la  U.S. Food and Drug Administration (FDA).

Este tipo de proyectos acercan cada vez más el uso de herramientas computacionales para acelerar la investigación en diferentes campos de la salud, ayudando a disminuir riesgos latentes y acelerar procesos que antes eran imposibles.

Fuente original: http://blogs.nvidia.com/blog/2015/02/18/johannes-kepler-university/

Adaptado por: Rodrigo Ochoa, Ing, MSc
Unidad de Antídotos - Diseño y ejecución de estrategias bioinformáticas
Correo: rodrigo.ochoa@udea.edu.co