Repositorio UTM
Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.utm.mx:8080/jspui/handle/123456789/121
Título : Análisis exploratorio de receptores acoplados a proteínas g mediante métodos de reducción de dimensionalidad
Autor : RAUL CRUZ BARBOSA;342911
Cruz Barbosa, Raúl
Castellanos Santa Cruz, Omar Januario
Palabras clave : métodos de aprendizaje automático, inteligencia, redes neurolanes
Fecha de publicación : dic-2016
Editorial : Universidad Tecnológica de la Mixteca
Citación : Castellanos, O. (2016). Análisis exploratorio de receptores acoplados a proteínas g mediante métodos de reducción de dimensionalidad (Tesis para obtener el grado de Maestro en Tecnologías de Cómputo Aplicado). Universidad Tecnológica de la Mixteca, Huajuapan de León, Oaxaca.
Resumen : Los receptores acoplados a proteínas G (G protein-coupled receptors, GPCRs) constituyen una super-familia de receptores celulares. Dichas proteínas son actores clave en la comunicación celular debido a que su función es transducir una amplia gama de señales y regular funciones celulares. Debido a que existen diversas enfermedades asociadas al mal funcionamiento de este tipo de proteínas, los GPCRs, son el objeto de estudio de distintas instituciones de investigación y de empresas farmacéuticas. La predicción de la función asociada a una proteína de forma automática mediante herramientas computacionales es uno de los objetivos de la bioinformática. Para poder procesar la información biológica de forma computacional el primer paso es modelar los datos. El problema del modelado de los datos de su forma biológica (alfabética) a su forma computacional (numérica) se ha atacado siguiendo el paradigma tradicional de estrutura-función, el cual indica que para cada proteína sólo corresponde una función. Este paradigma concuerda con el concepto tradicional de aprendizaje máquina, en el cual sólo es posible asociar una clase a cada muestra del conjunto de datos. En constraste, hace algunos años se descubrió que existen proteínas capaces de realizar más de una función, lo cual es un proceso bio-químico complejo que ha permitido encontrar una cantidad limitada de proteínas con dichas características. Por otro lado, recientemente ha surgido un nuevo enfoque de aprendizaje automático denominado aprendizaje multi-etiqueta, el cual es capaz de asociar instancias contenidas en el conjunto de datos a más de una clase. Dicho aprendizaje permite modelar problemas de una forma más realista que el aprendizaje tradicional. En este trabajo, los datos para ser analizados son secuencias de GPCRs de la clase C. Cada secuencia de proteína representada en forma biológica es sometida a cuatro transformaciones diferentes para obtener vectores de características de longitud fija con información numérica. Dichos vectores resultantes son de alta dimensionalidad lo cual incrementa la complejidad de su manipulación y visualización. Es por ello que es necesario reducir el número de variables de los vectores transformados. Existen diferentes métodos para realizar esta tarea, en esta investigación se comparan métodos tradicionales y se propone un nuevo enfoque de modelado de los datos, el cual supone que los vectores que representan a las proteínas pertenecen a múltiples clases. Antes de aplicar técnicas de aprendizaje automático se realiza un análisis exploratorio a las secuencias transformadas para observar de forma gráfica su disperción en el espacio 3D, y la correlación por pares de variables, entre otros datos estadísticos. Una vez que se estudia la estructura de los datos, se aplican técnicas de reducción de dimensionalidad y clasificación tradicional a estos y se comparan los resultados con el estado del arte. Después, se obtienen resultados análogos mediante un modelado de las secuencias con un enfoque multi-funcional. También, a la representación multi-funcional de las transformaciones se le aplican técnicas de reducción y clasificación utilizando el enfoque de aprendizaje multi-etiqueta. Finalmente, se analizan, comparan y discuten los resultados de ambos enfoques.
URI : http://repositorio.utm.mx:8080/jspui/handle/123456789/121
Aparece en las colecciones: Maestría

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
2016-MTCA-OCSC.pdf3.32 MBAdobe PDFVisualizar
facebook


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons