Viviana Lizeth Ayus Ortiz
El método de máxima verosimilitud fue propuesto por Fisher a principios del
siglo pasado. Su base estadística fue introducida al campo de la filogenética
por Edwards y Cavalli-Sforza hacia la década del 60. Sin embargo, no fue hasta
Neyman, 10 años más tarde, cuando se propuso la inferencia de filogenias usando
secuencias moleculares. La parte central de la inclusión de éste método
estadístico a la inferencia filogenética es ¿Cómo debe ser llevado a cabo el
cálculo? y en este sentido Felsenstein en (1981) propone cómo hacer el cálculo
de verosimilitud teniendo un número moderado de secuencias nucleotídicas.
El likelihood entendido como la probabilidad de los datos dada la
hipótesis p(D|H) es un tipo de probabilidad condicional. A lo largo del tiempo
se ha establecido que el likelihood tiene ciertas propiedades al
aumentar los datos con los que se cuenta, estas son, consistencia (capacidad de
converger al valor verdadero) y eficiencia (menor varianza alrededor del valor
verdadero).
Inicialmente las asunciones para el modelo de evolución que seguían las
secuencias bajo éste método establecían que la evolución era independiente en
distintos puntos del árbol y en diferentes linajes. Sin embargo, el desarrollo
y descubrimiento de nuevos modelos de evolución nucleotídica llevo a
modificaciones de las ecuaciones iniciales para tener en cuenta que las tasas
de cambio pueden seguir métodos Markovianos (aleatorios) o derivar y tener
tasas de cambio autocorrelaciondas. Además, el reto fue incluir al igual que en
métodos de distancia la variación entre sitios, para ello inicialmente se
utilizó la distribución gamma. Pero con tantos parámetros ¿Cómo hace este
método para economizar el tiempo de cómputo? Se desarrolló una “optimización”,
por así llamarlo, denominada “pruning” (Felsenstein 1981) que consiste en
computar polinomios de manera más rápida dentro del algoritmo. Por otro lado,
dada la fórmula general, se obtiene el likelihood por sitio y el likelihood
global está dado por el producto del cálculo por sitio.
Así como tiene sus ventajas frente a otras técnicas también se han
reconocido sus desventajas, entre las cuales podría mencionarse el hecho que no
existe estrategia para diferenciar si hay múltiples máximos en una respuesta,
de esta manera se asume que el valor resultante es el único máximo para la
inferencia llevada a cabo. Finalmente, los valores de máxima verosimilitud
pueden ser comparados, aún para corridas distintas ya que cada vez se estaría
evaluando la probabilidad de los datos dada una hipótesis filogenética
distinta.
Referencias
Felsenstein, J.
(2004) Inferring phylogenies. Sinauer Associates, USA.
Felsenstein, J.
(1981). Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of molecular evolution, 17(6),
368-376.
Comentarios
Publicar un comentario