Desde el punto de vista teórico, la probabilidad cumple con las siguientes propiedades (5):
- P(Z ≥ z) = valor tabulado (se busca en la tabla de La distribución normal)
- P(Z ≤ z) = 1 – P(Z ≥ z)
- P(Z≥ – z) = P(Z ≤ z)
- P(Z ≤ – z) = P(Z ≥ z)
Utilizando estas propiedades, la probabilidad de que se acepte la hipótesis alternativa como cierta, siendo en realidad falsa (error tipo II o β) (6) se determina de.
P (-0,17 ≤ Z ≤ 0,45) = P(Z ≥ -0,17) – P (Z ≥ 0,45)
P (-0,17 ≤ Z ≤ 0,45) =1 – P (Z ≥ 0,17) – P (Z ≥ 0,45)]
P (-0,17 ≤ Z ≤ 0,45) =1 – 0,4325 – 0,3264) = 0,2411
Es decir, existe un 24,11% de que esto se produzca.
Del resultado obtenido se infiere también que el azar no puede ser excluido del análisis, es decir, puede repetirse la prueba con otros pacientes y no obtener los mismos resultados.
La significación estadística depende de dos factores esenciales (6):
- La magnitud de la diferencia que se desea probar. Cuanto más grande sea la diferencia entre las dos variables, más fácil es demostrar que la diferencia es significativa. Por el contrario si la diferencia entre ambas variables es pequeña, las posibilidades de detectar diferencias entre las mismas se dificultan.
- El tamaño muestral. Cuanto más grande sea dicho tamaño más fácil es detectar diferencias entre las mismas. Pequeñas diferencias se pueden detectar con grandes tamaños muestrales y grandes diferencias entre variables necesitan muchos menos pacientes o individuos a ser estudiados. Cualquier diferencia puede ser estadísticamente significativa si se dispone del suficiente número de pacientes.
Veamos que ocurre cuando, en igualdad de condiciones, se hace uso de la segunda condición. Es decir, consideremos que la muestra ahora es, en vez de 15, de 150 pacientes en cada caso. Entonces se tiene que;
(P1 – P2) ± Z(1 – α/2) √[P (1 – P) (1/n1 +1/n2)]
0,14 ± 1,96√[(0,73) (1 – 0,73) (1/150 +1/150)]
0,14 ± 0,09
Es decir, ahora ocurre que 0,14 > 0,09 y sí hay significación estadística.
El intervalo de confianza es ahora:
[0,05; 0,23]
Debe observarse que el intervalo se encuentra desplazado hacia la parte derecha de la curva de distribución normal (ver anexo).
La probabilidad de que se acepte la hipótesis alternativa es, ahora:
P (0,05 ≤ Z ≤ 0,23) = P (Z ≥ 0,05) – P (Z ≥ 0,23) = 0,4801 – 0,4090
P (0,05 ≤ Z ≤ 0,23) = 0,0711
Es importante notar que la significación estadística no la da el valor de P calculado, sino la relación entre la diferencia de proporciones y el error de muestreo. En este último ejemplo se evidencia lo planteado ya que ΔP > EEZ y en cambio P > 0,05. Si se sigue aumentando el tamaño de la muestra, entonces la citada probabilidad disminuye y llega un momento en que, para un tamaño dado, se cumple que P < 0,05.
Esto último es un resultado que habla acerca del tamaño óptimo de una muestra (7, 8, 9), aunque para diferentes tipos de estudio existen diferentes formas de calcular el tamaño muestral. También lo tratado hasta ahora nos dice que las opciones terapéuticas utilizadas no han tenido diferencias, pero no sabemos nada acerca de la relevancia clínica de los resultados.
La relevancia clínica (10, 11) de un estudio va más allá de cálculos aritméticos y está determinada por el juicio clínico. La relevancia clínica depende de la magnitud de la diferencia, la gravedad del problema a investigar, la vulnerabilidad, la morbi-mortalidad generada por el mismo, su coste y por su frecuencia, entre otros elementos. Pero este es trabajo para otro artículo.
CONCLUSIONES
Se ha visto que el investigador debe tener cuidado al exponer los resultados de su investigación y emitir recomendaciones precipitadas. No son pocos los autores que, en la actualidad, desconfían del juicio del P-valor (12, 13, 14), lo que se ha podido demostrar en el ejemplo analizado.
Por otro lado se ha sido exhaustivo en los cálculos para que se entienda el procedimiento. Muchos, diríamos que demasiados investigadores, se apoyan en el empleo de paquetes estadísticos como el Epinfo, el Epidat o el SPSS en cualquiera de sus versiones.
En realidad, cuando se utiliza uno de estos paquetes, obtenemos un número frío y el análisis debe hacerlo el investigador. En cambio, en el propio proceso de cálculo emergen regularidades que nos van indicando cualidades para emitir juicios de valor, como en el caso del cálculo de la relación entre la diferencia de proporciones y el error del muestreo y su significación estadística. Esto, ningún paquete estadístico lo ofrece.
En el próximo artículo nos centraremos en el análisis de la relevancia clínica de un estudio, lo que nos acerca a la metodología de los ensayos clínicos y nos ofrece alternativas para el exitoso desarrollo de las investigaciones biomédicas.
Anexos – La significación estadística en las investigaciones biomédicas
Anexos – La significación estadística en las investigaciones biomédicas