Mutaciones puntuales de proteínas

Un problema que se presenta con cada vez mayor frecuencia desde que llegaron las tecnologías de ultrasecuenciación es el de estimar el fenotipo molecular de una mutación, por ejemplo un SNP observado en un paciente, que cambia la secuencia de aminoácidos de una proteína. Esto es necesario porque hay muchos más genotipos que fenotipos observados, y porque cuánto más se secuencia se hace patente que los individuos de una especie son portadores de múltiples mutaciones de diferente naturaleza (Peterson et al., 2013). Esto recuerda un poco a los resultados de Chothia & Lesk (1986), presentados en la sección 5.1, que ya observaron que los efectos de las mutaciones sobre la estructura (y por tanto la función) dependen en parte de dónde se produzcan. No tiene el mismo efecto cambiar un aminoácido enterrado que uno en un loop , o uno que coevoluciona con otro de un lazo vecino. Del mismo modo, una sustitución en el interior de una hélice no se puede comparar con la eliminación de un residuo catalítico (Berrondo & Gray, 2011) o de otro clave para interaccionar con otras proteínas (de Juan et al., 2013).

Figura 5.14: Grafo de la interfaz entre una histona-deacetilasa (en rojo) y tres parejas distintas, tomado de Cukuroglu et al. (2014).
Image ppi_interface

Figura 5.15: Frecuencias de sustitución de aminoácidos en enfermedades humanas, tomadas de Peterson et al. (2013).
Image human_mutations_heatmap

Como se muestra en la figura 5.16, hay una gran variedad de métodos para la inferencia del fenotipo molecular de mutaciones puntuales en proteínas, y solamente algunos usan información estructural. Probablemente el más universal de todos sea SIFT (Kumar et al., 2009), que usa como evidencia la historia evolutiva de cada familia de proteínas, que integra entre otras cosas determinantes estructurales siempre y cuando haya suficientes secuencias homólogas conocidas (Saunders & Baker, 2002). Sin embargo, como ocurre a menudo en biología computacional, no es sencillo averiguar a partir de un análisis de la literatura qué métodos son mejores. Hay que probarlos y escoger, y entre los disponibles haya cada vez más alternativas que hacen un uso explícito de información estructural, en concreto del contexto del residuo sustituido, como PolyPhen-2 (Adzhubei et al., 2010), SusPect (Yates et al., 2014) o mCSM (Pires et al., 2014).

Figura 5.16: Clasificación de métodos de inferencia de fenotipos de mutaciones no sinónimas, tomada de Peterson et al. (2013).
Image SNPpredictors

Figura 5.17: Comparación del rendimiento de SusPect prediciendo mutaciones humanas deletéreas frente a otros predictores, tomada de (Yates et al., 2014).
Image SNP_performance

Para explorar la predicción de fenotipos de mutaciones no sinónimas planteo este ejercicio:

PDF
Bruno Contreras-Moreira
http://www.eead.csic.es/compbio