El Rincn de Hipaso.

En el último decenio han aumentado las voces que reclaman prestar más atencin al enfoque bayesiano de los tests estadsticos. Un aspecto crucial de esta aproximacin consiste en que, a diferencia de los tests clásicos, que slo consideran el resultado del experimento actual, los análisis bayesianos incorporan la informacin previa disponible. En este artculo, Digenes Laercio presenta, de manera intuitiva, la esencia de ese enfoque y algunos de los argumentos más relevantes a favor y en contra
TESTS BAYESIANOS. Digenes Laercio

La idea básica es que las tesis inicialmente poco probables requieren, para ser aceptadas, datos empricos más favorables que las tesis inicialmente más probables. As lo hacemos en la vida común y es a todas luces obligado desde el punto de vista de la lgica. La llamada Inferencia Bayesiana tiene en cuenta esa incuestionable verdad.

Veamos este ejemplo de la vida cotidiana: Juan otea el cielo, en espera de que haga un da soleado para salir al campo, y lo ve parcialmente nuboso. Si esto ocurre en Escocia (donde llueve el 82% de los das) se inclinará por no iniciar la excursin, ante el temor de que llueva. Pero si ocurre en Almera (donde llueve el 4% de los das) se pondrá en marcha, confiado en que las nubes dejarán paso a un radiante sol. Ante un mismo dato observado – cielo parcialmente nuboso – se emite un pronstico muy distinto según sea la informacin previa que tengamos sobre ese tema. Y se puede demostrar que actuando de este modo la prediccin del clima es a la larga más exitosa que si se ignorara la experiencia previa.

Pero la aplicacin de la tcnica bayesiana implica manejar algunos valores que no siempre están claramente establecidos y ello crea dificultades y limitaciones prácticas considerables.

1. El examen final y el rendimiento previo

Para formarse opinin acerca de si una hiptesis de trabajo es o no cierta, los tests clásicos solo tienen en cuenta el resultado del experimento actual, mientras que los tests bayesianos incorporan, además, la informacin previa que haya sobre ello. Concretamente, empiezan estimando cuál es la probabilidad de que la hiptesis de trabajo sea cierta antes de hacer el experimento (probabilidad “a priori”) y luego cal- ˇculan esa probabilidad teniendo en cuenta el resultado del experimento (Probabilidad “a posteriori”).

La mayor objecin que se hace al enfoque bayesiano es que la mayora de las veces no se puede cuantificar como frecuencia relativa la probabilidad de que la hiptesis de trabajo sea cierta. Por ejemplo, si la hiptesis de trabajo es que un nuevo fármaco cura mayor porcentaje de pacientes que el tratamiento clásico, no parece viable expresar la confianza que tenemos en que eso sea cierto mediante una frecuencia relativa.

Pero en defensa del enfoque bayesiano se puede alegar que los conceptos de “muy probable” y “poco probable” son válidos y utilizables aunque no se puedan cuantificar mediante frecuencias relativas.

Comenzaremos viendo un ejemplo que nos ayude a valorar si es lcito y útil cuantificar la nocin de “grande” o “pequeo”, cuando no hay inicialmente un valor numrico asociado.

Si un alumno hace un examen final mediocre y sus notas parciales previas son altas, el profesor lo aprobará, pero si las notas previas son muy malas lo suspenderá. Puede demostrarse que con este criterio el profesor está optimizando sus probabilidades de hacer justicia, de modo que actuando siempre as, a la larga hara justicia más veces que si ignorara las notas previas. Llamemos NP a la nota media de los exámenes parciales y NF a la nota alcanzada en el examen final, ambas en una escala de 0 a 10.

Los tests clásicos equivaldran a calificar al alumno teniendo en cuenta únicamente la NF, mientras que los tests bayesianos tienen en cuenta, además, la NP. Asumamos que, para tener en cuenta el rendimiento durante el curso, se pone como nota definitiva la media de NP y NF. Habrá acuerdo prácticamente unánime en que esta nota media reflejará mejor que la NF el nivel de conocimientos que tiene el alumno. Ahora supongamos que la NP se ha perdido y no se puede proceder al cálculo de la media definitiva. El enfoque clásico de la inferencia equivale a decir que en este caso, debemos establecer la calificacin definitiva basándonos únicamente la NF. El bayesiano equivale a decir que si el profesor recuerda que el alumno tena muy buenas calificaciones previas, parece obligado tener en cuenta dicha informacin, aunque se haya perdido la calificacin exacta. Ello podra hacerse atribuyendo al alumno una nota acorde con la impresin que el profesor tiene sobre su rendimiento durante el curso. Si recuerda que el alumno tena un comportamiento brillante, se puede poner una nota de 9 y si recuerda que el alumno tena un comportamiento muy pobre se puede poner una nota de 2. Estas aproximaciones, dicen los bayesianos – y el sentido común–, son menos malas que ignorar totalmente el rendimiento durante el curso.

Podemos ilustrar esto con números concretos. Supongamos que la NF ha sido 4.5. Si el alumno ha tenido muy buen rendimiento durante el curso y su nota se ha perdido y estimamos su NP en 8.5, la media definitiva será 6.5, mientras que si estimamos su NP en 9.5 la media definitiva será 7. En cualquier caso, el profesor puede argumentar que la NP del alumno sera superior a 8 y por tanto la nota definitiva debe ser superior a 6.25, lo que supone un aprobado holgado.

Pero si ha tenido muy bajo rendimiento durante el curso y se estima la NP en 2, la media es 3.25 y si se estima la NP en 2.5 la media es 3.5. Tambin ahora parece razonable buscar una cifra máxima, argumentando, por ejemplo, que en todo caso la NP de ese alumno sera inferior a 3, y, por tanto, la definitiva sera inferior a 3.75, lo que implicara un suspenso claro.

2. Un ejemplo del área mdica donde la probabilidad a priori no puede establecerse como una frecuencia relativa.

Para la enfermedad D no hay tratamiento y se curan de forma espontánea el 70% de los pacientes. Nos proponen un nuevo tratamiento, A, del que su promotor dice que es eficaz, es decir, cura más del 70%.

En un estudio piloto, el tratamiento se prueba en N = 6 pacientes y si es inútil esperamos, tericamente, que se curen 4, (el 70% de 6 es 4.2). En la práctica result que curaron los 6 pacientes tratados con A. El test clásico calcula el valor P = P (todos curados si A no es eficaz) = 0.76 = 0.117 (1). Por tanto los datos (6 curaciones de 6 tratados) sugieren que A podra curar más del 70%, pero no son una fuerte evidencia en ese sentido .

El test clásico se quedara en esta duda, mientras que el enfoque bayesiano intenta llegar más allá teniendo en cuenta, además, la informacin previa que se tiene sobre el problema que se investiga.

En nuestro ejemplo, si A es propuesto por un laboratorio farmacutico con largo historial de xitos farmacolgicos, nuestra sospecha de que A es eficaz se vera acentuada. Por el contrario, si el producto A es propuesto por un “para-mdico” muy poco fiable por haber acumulado muchos fracasos previos, nos inclinaremos a pensar que A no es eficaz.

La inferencia Bayesiana incorpora los razonamientos que acabamos de exponer, pero cuantificando algunas magnitudes para intentar calcular la probabilidad de que la hiptesis nula sea cierta. Y en ese proceso de cuantificacin suelen aparecer ciertas dificultades que iremos viendo en nuestro ejemplo. a) En primer lugar hay que cuantificar la probabilidad inicial, previa a nuestro experimento, de que A es útil. En la mayora de los casos no hay informacin que permita cifrar esa probabilidad en una determinada cantidad, ni siquiera por aproximacin. Si A es propuesto por un laboratorio muy acreditado, diremos que la probabilidad de que sea útil es “alta”, pero no la podremos especificar si es, por ejemplo, 78% u 87% o 96%, u otra cantidad prxima a la unidad. Si por el contrario, lo propone el curandero poco fiable, diremos que la probabilidad de que sea útil es baja, pero, de nuevo, sin poder especificar si se trata de, por ejemplo, 0.1% o 2% o 7% o cualquier otro valor prximo a cero. b) Los cálculos Bayesianos requieren, además, especificar la hiptesis de trabajo. En nuestro ejemplo tenemos que especificar cuál es la eficacia del tratamiento A, es decir, qu % de curaciones atribuimos al tratamiento. No basta con decir que confiamos en que A cure “más del 70%”, tenemos que concretar cuál sera ese % superior a 70%.

El siguiente cuadro indica los valores de la probabilidad de que “A” cure realmente cierto porcentaje para diferentes cantidades de las dos magnitudes que requieren ser especifi- cadas (probabilidades “a posteriori”).

A modo de ejemplo interpretemos dos valores de esta -Si sabemos que un fármaco realmente cura 70% u 80%, y si la confianza en que el % real de curaciones sea 80%, es P = 0.02, entonces la probabilidad de que el % real de curaciones sea 80% es P = 0.04

-Si la confianza inicial en que cure 80% fuera 0.10, la probabilidad de que sea cierto es 0.20 y si la confianza inicial en que cure 80% fuera 0.85, la probabilidad de que sea cierto es 0.93 .... Pero si sabemos que un fármaco realmente cura 70% u 90%, y si la confianza en que el % real de curaciones sea 90% es P = 0.02, entonces la probabilidad de que el % real de curaciones sea 90% es P = 0.08 Resumiendo, el test clásico nos da valor P = 0.117, que es una evidencia muy modesta a favor de la eficacia. El enfoque bayesiano nos dice que si ciframos la eficacia del fármaco en que cure el 80% de los pacientes y es recomendado por un laboratorio fiable que tiene xito en aproximadamente el 95% de sus productos, la probabilidad de que ste sea eficaz es del 98%. Si, por el contrario, quien propone que el nuevo fármaco que cura el 80% de los pacientes es una persona poco fiable, del que se sabe que ha tenido xito en slo aproximadamente el 2% de sus propuestas, la probabilidad de que el fármaco sea eficaz estara en torno al 4%. Vemos que el tener en cuenta la informacin previa, en este caso la fiabilidad del promotor, nos ayuda a describir mejor la realidad, lo cual redundará, llegado el caso, en acciones más correctas.

Digenes Laercio
Departamento de Estadstica. Universidad Complutense
E-mail: tatopv@med.ucm.es

Portada	C. Presidente	Autores	Destellos	Mtodo	Actualizacin
Actualizacin 2	R. Hipaso	Docencia	Opinin	Libros	Ventana F.