La expresión génica vista por un físico III: Interpretación de probabilidades. Resultados


Llegamos ya a la última entrada de la serie, que viene precedida por:

Dogma central de la biología. Enfoque determinista

Introducción al enfoque estocástico

Hemos visto que al aplicar el planteamiento estocástico de Gillespie al mecanismo de expresión génica se modela un conjunto de macromoléculas contenidas en una célula en relación a la probabilidad que tienen de chocar y reaccionar entre sí. Así, el hecho de que una reacción concreta tenga lugar se puede descomponer en dos sucesos de naturaleza aleatoria con sus respectivas probabilidades:

1. Tras un tiempo  sin reacciones, se produce una reacción cualquiera

\boldsymbol{P_1=v_0e^{-v_0\tau}dt}

2. La reacción que se produce es concretamente la reacción

\boldsymbol{P_2=\dfrac{v_\mu}{v_0}}

El objetivo del modelo de Gillespie es obtener la información que nos diga qué reacciones se producen y en qué instante. El resultado de aplicar el método debe ser algo parecido a lo siguiente:

¿Cómo se usan las ecuaciones de probabilidad para conseguir la tabla anterior? Empezamos con la más sencilla, P_2, que nos proporciona la información de la columna derecha.

¿Qué reacciona?

Un pequeño ejemplo usando números permite entender fácilmente la idea que hay detrás del enfoque estocástico.

Supongamos valores para la velocidad de cada una de las cuatro reacciones, por ejemplo v_1=7, v_2=4, v_3=6 y v_4=3, para los cuales es inmediato calcular v_0=\sum_{i=1}^{4}v_i=20. Ya podemos calcular el valor de P_2 para cada reacción. Como hay cuatro reacciones, representaremos la probabilidad de la reacción \mu como P_2(\mu). Obtenemos:

P_2(1)=\dfrac{7}{20}=0.35  ;  P_2(2)=\dfrac{4}{20}=0.20

P_2(3)=\dfrac{6}{20}=0.30  ;  P_2(4)=\dfrac{3}{20}=0.15

Como vimos en la entrada anterior, esto significa que después de que se produzcan 100 reacciones es esperable que 35 sean de producción de ARN, 20 de producción de proteína, 30 de destrucción de ARN y 15 de destrucción de proteína. ¿Cómo decidir cuál es la reacción afortunada en cada caso? Para ello tenemos que añadir un toque de aleatoriedad que respete las probabilidades arriba especificadas.

Una posible idea sería construir un dado perfectamente tallado con 100 caras, de manera que en 35 de ellas apareciera el número 1, en 20 el número 2, en 30 el 3 y en las otras 15 el 4. Este dado cumple las probabilidades que hemos calculado arriba y el resultado de lanzarlo nos diría qué reacción elegir.

Por suerte hay caminos más sencillos. Lo habitual es usar un ordenador para generar un número aleatorio comprendido entre 0 y 1, al que llamaremos r_2 (porque lo usamos con P_2). Este número lo comparamos con una recta que represente las probabilidades anteriores y dependiendo de dónde caiga r_2 en la recta elegiremos qué reacción se produce. Por ejemplo, si r_2=0.61 elegimos la tercera reacción ( \mu=3)

¿Cuándo reacciona?

Ahora vamos a por el plato fuerte. La idea es parecida al caso anterior, generar un número aleatorio ( r_1) para relacionarlo con el tiempo que pasa entre cada reacción ( \tau). Recordemos que la probabilidad en este caso es P_1=v_0e^{-v_0\tau}dt.

El problema ahora es que, a diferencia de \mu, \tau puede tomar infinitos valores. Esto viene reflejado en la ecuación por el término dt (representa un intervalo de tiempo muy pequeño), capaz de estremecer a cualquiera. Si por un momento nos olvidamos de él y representamos gráficamente p_1=v_0e^{-v_0\tau} ( p_1 es lo que se conoce como densidad de probabilidad) usando también v_0=20 tenemos:

En la gráfica se ha representado un rectángulo (tan estrecho que parece una línea)  de color verde y otro rojo, con anchura igual a dt. El área de cada rectángulo es igual a su base por su altura:

Es decir, la probabilidad de que el tiempo entre dos reacciones sea \tau es igual al área del rectángulo de anchura dt y altura v_0e^{-v_0\tau} . El área de cada uno de los rectángulos es muy pequeña, pero está claro que cuanto más pequeño es \tau mayor es ésta, y por tanto mayor la probabilidad de que ese sea el tiempo entre reacciones. Vemos por tanto que el área bajo la curva tiene un importante significado.

En la sección anterior hemos representado una recta para relacionar un número aleatorio con la probabilidad de reacción, colocando encima de la recta cuatro zonas (una tras otra) con anchura igual a la probabilidad de cada reacción. En este caso tendríamos que dividir la recta en infinitas zonas cuya anchura sea el área de cada línea, por lo que iríamos acumulando áreas, barriendo la gráfica de izquierda a derecha.

Hacer esto manualmente, como en el caso anterior, sería insufriblemente tedioso. Por suerte en matemáticas hay una herramienta para calcular áreas acumuladas bajo curvas sin tener que ponerse a contar cuadraditos, la integral.

\boldsymbol{\int_{0}^{\tau} v_0e^{-v_0\tau}\,dt=1-e^{-v_0\tau}}

En esta gráfica hemos añadido en rojo la representación del área acumulada bajo la curva, cuyo valor puede leerse en el eje de la derecha. Esta gráfica es el equivalente a la recta representada en el primer caso. Ahora simplemente hay que generar un número aleatorio r_1 y hacerlo corresponder con un valor de \tau usando la curva para el área acumulada. Se puede ver en la gráfica que si r_1=0.4, \tau=0.025 segundos.

Algoritmo del método estocástico

Ya tenemos toda la información necesaria para resolver el problema aplicando el enfoque estocástico. Los pasos a seguir para escribir un programa y hacer simulaciones son los siguientes:

0.- Especificamos los valores de las constantes de reacción (k, s, \delta_m y \delta_p) y fijamos a cero la cantidad inicial de moléculas presentes.

1.- Calculamos las velocidades de reacción.

2.- Generamos los números aleatorios r_1 y r_2 y obtenemos \tau y \mu a partir de ellos.

3.- Usando \mu modificamos la población de macromoléculas aumentando o disminuyendo la cantidad en una unidad: si \mu=1 añadimos un ARN, si es 2 añadimos una proteína, si es 3 restamos ARN y si es 4 restamos proteína.

4.- Usando \tau actualizamos el tiempo que ha transcurrido. Regresamos al paso 1 y repetimos el proceso un gran número de veces.

Resultados

Una primera simulación ofrece el siguiente resultado sobre el número de moléculas a lo largo del tiempo:

En azul se indica la cantidad de ARN y en rojo la cantidad de proteína, mientras que las líneas negras indican la evolución predicha por el modelo determinista. Se puede comprobar que efectivamente el modelo determinista es algo así como la tendencia alrededor de la cual serpentean los valores estocásticos. Puesto que el proceso es de naturaleza estocástica, es esperable que una segunda simulación arroje un valor distinto al de la primera. En efecto, si superponemos dos simulaciones vemos que aparecen dos líneas rojas y dos azules:

Ante esta situación cabe preguntarse ¿cuál de las dos líneas es la correcta? La respuesta es tan sencilla como aparentemente desesperanzadora: ninguna. En efecto, después de tanto esfuerzo para entender y aplicar el método estocástico, resulta que no es capaz de proporcionarnos la evolución real del sistema. Entonces, ¿para qué lo hemos usado? Recurrimos al enfoque estocástico no porque queramos conocer la evolución exacta del sistema (lo cual es imposible por la aleatoriedad inherente al proceso), sino porque queremos tener una idea de lo lejos que puede estar la realidad de lo predicho por el modelo determinista. Ejemplifiquemos algunos casos a continuación, disminuyendo progresivamente la cantidad de macromoléculas del sistema en equilibro:

Al superponer una gran cantidad de simulaciones en cada gráfica queda ilustrado que las predicciones deterministas son el promedio de las estocásticas. La desviación respecto al promedio la indica la anchura de las franjas de color. En las gráficas se comprueba que la desviación es mayor cuanto menos moléculas hay presentes. El ruido es más significativo a menores cantidades porque en esas condiciones los choques entre partículas son más improbables y se ve más reflejado el carácter discreto y aleatorio del sistema reaccionante.

Conclusiones y consecuencias

El movimiento molecular térmico es el responsable del choque y reacción de un grupo de moléculas. En el enfoque determinista se considera, en una aproximación, que la cantidad de choques efectivos es una variable continua (puede ser decimal) y perfectamente calculable. Esa simplificación es satisfactoria siempre y cuando la variación del número de choques no se aleje demasiado del valor medio.

Generalmente se ha considerado que esta aleatoriedad puede tener efectos negativos en las funciones celulares, pudiendo ocasionar enfermedades porque la cantidad de proteínas en la célula sea insuficiente o excesiva. Sin embargo también es posible que presente efectos ventajosos, puesto que puede aportar la flexibilidad necesaria para la adaptación de las células a condiciones del entorno cambiantes o agresivas, así como inducir principios evolutivos.

Un interesante ejemplo de esto lo encontramos al tratar una infección con antibióticos. El medicamento es capaz de eliminar a la gran mayoría de los microrganismos infecciosos, pero en el momento en que se administra es posible que una pequeña población de las bacterias posea una cantidad excesiva de proteínas para defenderse del antibiótico y sobreviva. Esta pequeña población puede evolucionar para adaptarse a esas condiciones de trabajo, especialmente si creemos que ya estamos curados y dejamos de tomar la medicación antes de la fecha recomendada, volviendo a provocar una infección que ahora será considerablemente más difícil de eliminar.

Nos seguimos leyendo…

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s