El análisis de supervivencia, o más generalmente, el análisis del tiempo hasta el evento, se refiere a un conjunto de métodos para analizar el período de tiempo hasta la ocurrencia de un punto final de interés bien definido (Fuente: PUBMED).
Las técnicas del análisis de supervivencia, también llamado “time to event” se remontan a las tablas de vida en las que los médicos medían si con un tratamiento específico los pacientes aumentarían sus probabilidades de sobrevivir. Estos métodos se expandirían en áreas como lo son la sociología, la economía, la biología y otras muchas ramas.
Para que los datos sean “time to event”, cada observación debe tener la posibilidad de que haya vivido un evento (por ejemplo, estar casado o no), pero cada una de las observaciones puede tener distintas duraciones (hay personas que siguen solteras a los 20 y otras a los 35). Para este tipo de muestra una regresión lineal ordinaria tendría problemas, ya que en la medición de nuestros datos no sabemos si las personas que todavía no viven el evento (es decir, que todavía no se casan) cuándo lo podrán hacer (si es que sucede). Esto es, técnicamente que los datos están censurados hacia la derecha. Aunque ya terminó el experimento, no así la posibilidad de supervivencia. Esto significa que una regresión lineal ordinaria tendría un sesgo y que por lo tanto debemos usar otros procedimientos como el análisis de supervivencia.

Algunas funciones son relevantes para poder medir estos datos de “time to event. Si denominamos S(t) la función de supervivencia, t el tiempo y F(t) la probabilidad de que el evento ya haya ocurrido antes del tiempo t:
S(t) = 1- F(t)
Esto quiere decir que la definición de función de supervivencia S(t) es la probabilidad de que el evento haya durado más que un tiempo t, es decir mide la probabilidad de que el evento todavía no haya ocurrido. En nuestro ejemplo nos ayudaría a medir cuál es la probabilidad de que una persona no se haya casado si ya han pasado t número de años.
Para estos análisis, es importante estimar cuál es la función de supervivencia. Un método es la estimación Kaplan-Meier. Este se basa en multiplicar la fracción de sobrevivientes en la muestra (es decir los que no les ha ocurrido el evento) por cada período que transcurre.
Ejemplo: Si 10 personas no tienen trabajo y 4 lo consiguen en el primer mes, un 60% sobrevive al evento (sigue desempleado). Para calcular el siguiente período, sólo tengo 6 personas que siguen sin trabajo. Si en ese segundo mes 3 más consiguen trabajo, entonces la probabilidad de sobrevivir al evento después de 2 meses será de 30%, que es el 60% que consiguió empleo la primera vez multiplicado por el 50% que lo obtuvo el segundo.

Para estos análisis, es importante estimar cuál es la función de supervivencia. Un método es la estimación Kaplan-Meier. Este se basa en multiplicar la fracción de sobrevivientes en la muestra (es decir los que no les ha ocurrido el evento) por cada período que transcurre.
Ejemplo: Si 10 personas no tienen trabajo y 4 lo consiguen en el primer mes, un 60% sobrevive al evento (sigue desempleado). Para calcular el siguiente período, sólo tengo 6 personas que siguen sin trabajo. Si en ese segundo mes 3 más consiguen trabajo, entonces la probabilidad de sobrevivir al evento después de 2 meses será de 30%, que es el 60% que consiguió empleo la primera vez multiplicado por el 50% que lo obtuvo el segundo.

Hay otros métodos más sofisticados que son más utilizados como lo son la regresión de Cox, que tienen la ventaja de poder obtener razones de riesgos.
Para entender que es la razón de riesgos, hay que entender primero qué es la función de riesgo. Ésta nos indica cuál es la probabilidad instantánea de que ocurra un evento. Esto sólo tiene sentido en observaciones que no han vivido el evento. Por ejemplo: ¿cuál es la probabilidad de que me case en este momento si tengo 28 años?
Si dividimos dos funciones de riesgo, obtenemos la razón de riesgo. Esta razón nos permite ver si una variable en particular aumenta la probabilidad de que un evento ocurra. Ejemplo: Si la probabilidad de encontrar trabajo después de 6 meses es del 40% si soy titulado y del 20% si no lo estoy, podría concluir que contar con un título profesional me da el doble de posibilidad de conseguir un trabajo. Aquí podemos observar, que podemos calcular el efecto de una característica particular sobre 2 sujetos en la misma situación salvo en la variable que queremos observar.
Como puedes ver, el análisis de supervivencia tiene muchas aplicaciones y son métodos que son cada vez más utilizados no sólo por médicos, sino también en distintas ramas de investigación y en la industria para poder estimar tanto probabilidades como factores de riesgo en observaciones que sabemos cuánto han durado en una situación.
– Keep it weird –
Fuentes:
https://towardsdatascience.com/survival-analysis-intuition-implementation-in-python-504fde4fcf8e