LA PROBABILIDAD EN LA INFERENCIA ESTADÍSTICA
La probabilidad de que la hipótesis nula sea verdadera o de
que la hipótesis alternativa sea verdadera, puede basarse en cálculos
informados en parte por los resultados observados, pero esto no es lo mismo que
un valor p.
En la investigación científica que implica hipótesis sobre
los efectos de una intervención, por lo tanto cuando se investiga, se busca
evitar dos tipos de error que pueden conducir a la no replicabilidad:
- Error tipo I: un falso positivo o un rechazo de la hipótesis nula cuando es correcta.
- Error de tipo II: un falso negativo o la imposibilidad de rechazar una hipótesis nula falsa, lo que permite que la hipótesis nula se mantenga cuando una hipótesis alternativa, y no la hipótesis nula, es correcta.
Idealmente, los errores de Tipo I y Tipo II se reducirían
simultáneamente en la investigación. Por ejemplo, aumentar el poder estadístico
de un estudio al aumentar el número de sujetos en un estudio puede reducir la
probabilidad de un error de Tipo II, para cualquier probabilidad dada de error
de Tipo I.
Aunque el aumento de datos que viene con estudios de mayor eficacia,
puede ayudar a reducir los errores de Tipo I y Tipo II, agregar más sujetos
generalmente significa más tiempo y costo para un estudio o investigación.
Los investigadores a menudo se ven obligados a hacer
compensaciones, en las que la reducción de la probabilidad de un tipo de error
aumenta la probabilidad del otro. Por ejemplo, cuando los valores de p se
consideran útiles, los errores de Tipo I pueden minimizarse reduciendo el
umbral de significancia a un nivel más estricto (por ejemplo, bajando el
estándar p ≤ 0.05 a p ≤ 0.005).
Sin embargo, esto aumentaría simultáneamente la probabilidad
de un error de Tipo II. En algunos casos, puede ser útil definir zonas
interpretativas separadas, donde los valores p por encima de un umbral de
significación no se consideran significativos, los valores p por debajo de un
umbral de significación más estricto se consideran significativos, así los valores
entre los dos umbrales se consideran no concluyentes.
Alternativamente, se podría simplemente aceptar el valor p
calculado para lo que es (la probabilidad de obtener el resultado observado o
un extremo más si la hipótesis nula fuera cierta) y abstenerse de interpretar
los resultados como "significativos" o "no significativos".
"La dependencia tradicional de un umbral único para determinar la
importancia puede incentivar comportamientos que van en contra del progreso
científico.
Puede surgir tensión entre la replicabilidad y el
descubrimiento, específicamente, entre la replicabilidad y la novedad de los
resultados. Las hipótesis con bajas probabilidades a priori tienen menos
probabilidades de ser replicadas.
En este sentido, Wilson y Wixted (2018) ilustraron cómo los
campos que están investigando resultados potencialmente innovadores producirán
resultados que son menos replicables, en promedio, que los campos que están
investigando resultados altamente probables y casi establecidos.
De hecho, un campo podría lograr una replicabilidad casi
perfecta si limitara sus investigaciones a fenómenos prosaicos que ya eran bien
conocidos. Como Wilson y Wixted (2018, pág. 193) afirman: "Podemos
imaginar páginas llenas de hallazgos de que las personas tienen hambre después
de perderse una comida o que tienen sueño después de permanecer despiertos toda
la noche", lo que no sería muy útil "para avanzar en la comprensión
del mundo". En el mismo sentido, no sería útil para un campo centrarse
únicamente en hipótesis improbables y extravagantes.
El poder estadístico es la probabilidad de que una prueba
rechace la hipótesis nula cuando una hipótesis alternativa específica es
verdadera. La hipótesis, aunque este camino también conduce a callejones sin
salida y a ideas que parecen prometedoras al principio pero que no logran
sobrevivir después de repetidas pruebas.
Teniendo en cuenta la idea de probabilidad previa, la
investigación enfocada en hacer pequeños avances al conocimiento existente
daría como resultado una alta tasa de replicación (es decir, una alta tasa de
replicaciones exitosas), porque los investigadores buscarían resultados que
probablemente sean correctos. Pero hacerlo tendría el efecto indeseable de
reducir la probabilidad de hacer nuevos descubrimientos importantes ( Wilson y
Wixted, 2018), muchos avances importantes en la ciencia han resultado de un
enfoque más audaz basado en más especulativos.
Estas conclusiones diferentes ilustran la importancia de
considerar los resultados de cualquier estudio individual en el contexto de
otros resultados, particularmente si los resultados son intrínsecamente
sorprendentes. Este es un paso importante hacia la construcción de un cuerpo de
evidencia sobre el cual llegar a una conclusión y no dejarse llevar por un
resultado novedoso, y quizás poco confiable.
Los enfoques "seguros" y "audaces" de la
ciencia tienen ventajas complementarias. Se podría argumentar que un campo se
ha vuelto demasiado conservador si todos los intentos de replicar los
resultados son exitosos, pero es razonable esperar que los investigadores hagan
un seguimiento de los nuevos pero inciertos descubrimientos con estudios de
replicación para determinar qué resultados prometedores resultan correctos. Los
científicos deben conocer el nivel de incertidumbre inherente a las hipótesis
especulativas y los resultados sorprendentes en cualquier estudio individual.
El objetivo de la ciencia no es, y no debería ser,
que todos los resultados sean replicables, los informes de no replicación de
resultados pueden generar entusiasmo, ya que pueden indicar posibles nuevos
fenómenos y la expansión del conocimiento actual. Además, se espera cierto
nivel de no replicabilidad cuando los científicos e investigadores, estudian
nuevos fenómenos que no están bien establecidos; a medida que mejora el
conocimiento de un sistema o fenómeno, se espera que aumente la replicabilidad
de los estudios de ese sistema o fenómeno en particular.
Comentarios
Publicar un comentario