LA PROBABILIDAD EN LA INFERENCIA ESTADÍSTICA

La probabilidad de que la hipótesis nula sea verdadera o de que la hipótesis alternativa sea verdadera, puede basarse en cálculos informados en parte por los resultados observados, pero esto no es lo mismo que un valor p.

En la investigación científica que implica hipótesis sobre los efectos de una intervención, por lo tanto cuando se investiga, se busca evitar dos tipos de error que pueden conducir a la no replicabilidad:
  • Error tipo I: un falso positivo o un rechazo de la hipótesis nula cuando es correcta.
  • Error de tipo II: un falso negativo o la imposibilidad de rechazar una hipótesis nula falsa, lo que permite que la hipótesis nula se mantenga cuando una hipótesis alternativa, y no la hipótesis nula, es correcta.

Idealmente, los errores de Tipo I y Tipo II se reducirían simultáneamente en la investigación. Por ejemplo, aumentar el poder estadístico de un estudio al aumentar el número de sujetos en un estudio puede reducir la probabilidad de un error de Tipo II, para cualquier probabilidad dada de error de Tipo I.

Aunque el aumento de datos que viene con estudios de mayor eficacia, puede ayudar a reducir los errores de Tipo I y Tipo II, agregar más sujetos generalmente significa más tiempo y costo para un estudio o investigación.

Los investigadores a menudo se ven obligados a hacer compensaciones, en las que la reducción de la probabilidad de un tipo de error aumenta la probabilidad del otro. Por ejemplo, cuando los valores de p se consideran útiles, los errores de Tipo I pueden minimizarse reduciendo el umbral de significancia a un nivel más estricto (por ejemplo, bajando el estándar p ≤ 0.05 a p ≤ 0.005).

Sin embargo, esto aumentaría simultáneamente la probabilidad de un error de Tipo II. En algunos casos, puede ser útil definir zonas interpretativas separadas, donde los valores p por encima de un umbral de significación no se consideran significativos, los valores p por debajo de un umbral de significación más estricto se consideran significativos, así los valores entre los dos umbrales se consideran no concluyentes.

Alternativamente, se podría simplemente aceptar el valor p calculado para lo que es (la probabilidad de obtener el resultado observado o un extremo más si la hipótesis nula fuera cierta) y abstenerse de interpretar los resultados como "significativos" o "no significativos". "La dependencia tradicional de un umbral único para determinar la importancia puede incentivar comportamientos que van en contra del progreso científico.

Puede surgir tensión entre la replicabilidad y el descubrimiento, específicamente, entre la replicabilidad y la novedad de los resultados. Las hipótesis con bajas probabilidades a priori tienen menos probabilidades de ser replicadas.

En este sentido, Wilson y Wixted (2018) ilustraron cómo los campos que están investigando resultados potencialmente innovadores producirán resultados que son menos replicables, en promedio, que los campos que están investigando resultados altamente probables y casi establecidos.

De hecho, un campo podría lograr una replicabilidad casi perfecta si limitara sus investigaciones a fenómenos prosaicos que ya eran bien conocidos. Como Wilson y Wixted (2018, pág. 193) afirman: "Podemos imaginar páginas llenas de hallazgos de que las personas tienen hambre después de perderse una comida o que tienen sueño después de permanecer despiertos toda la noche", lo que no sería muy útil "para avanzar en la comprensión del mundo". En el mismo sentido, no sería útil para un campo centrarse únicamente en hipótesis improbables y extravagantes.

El poder estadístico es la probabilidad de que una prueba rechace la hipótesis nula cuando una hipótesis alternativa específica es verdadera. La hipótesis, aunque este camino también conduce a callejones sin salida y a ideas que parecen prometedoras al principio pero que no logran sobrevivir después de repetidas pruebas.

Teniendo en cuenta la idea de probabilidad previa, la investigación enfocada en hacer pequeños avances al conocimiento existente daría como resultado una alta tasa de replicación (es decir, una alta tasa de replicaciones exitosas), porque los investigadores buscarían resultados que probablemente sean correctos. Pero hacerlo tendría el efecto indeseable de reducir la probabilidad de hacer nuevos descubrimientos importantes ( Wilson y Wixted, 2018), muchos avances importantes en la ciencia han resultado de un enfoque más audaz basado en más especulativos.

Estas conclusiones diferentes ilustran la importancia de considerar los resultados de cualquier estudio individual en el contexto de otros resultados, particularmente si los resultados son intrínsecamente sorprendentes. Este es un paso importante hacia la construcción de un cuerpo de evidencia sobre el cual llegar a una conclusión y no dejarse llevar por un resultado novedoso, y quizás poco confiable.

Los enfoques "seguros" y "audaces" de la ciencia tienen ventajas complementarias. Se podría argumentar que un campo se ha vuelto demasiado conservador si todos los intentos de replicar los resultados son exitosos, pero es razonable esperar que los investigadores hagan un seguimiento de los nuevos pero inciertos descubrimientos con estudios de replicación para determinar qué resultados prometedores resultan correctos. Los científicos deben conocer el nivel de incertidumbre inherente a las hipótesis especulativas y los resultados sorprendentes en cualquier estudio individual.

El objetivo de la ciencia no es, y no debería ser, que todos los resultados sean replicables, los informes de no replicación de resultados pueden generar entusiasmo, ya que pueden indicar posibles nuevos fenómenos y la expansión del conocimiento actual. Además, se espera cierto nivel de no replicabilidad cuando los científicos e investigadores, estudian nuevos fenómenos que no están bien establecidos; a medida que mejora el conocimiento de un sistema o fenómeno, se espera que aumente la replicabilidad de los estudios de ese sistema o fenómeno en particular.

Comentarios

Entradas populares de este blog

Metodología