PRUEBAS DE INFERENCIA ESTADÍSTICA E HIPÓTESIS

A medida que los investigadores exploran el mundo a través de nuevos estudios y observaciones científicas, la evidencia puede desafiar las teorías existentes. El proceso científico permite implicar revisiones o cambios en la comprensión actual.

La prueba de los modelos y teorías existentes a través de la recopilación de datos nuevos es útil para establecer su preponderancia así como sus límites (es decir, su capacidad de generalización) y en última instancia, ese proceso es inevitable a medida que los científicos e investigadores, desarrollan mejores métodos para evaluar y observar en el proceso de expansión del conocimiento.

El advenimiento del nuevo conocimiento científico, que desplaza o replantea el conocimiento previo no debe interpretarse como una debilidad en la ciencia. El conocimiento científico se basa en estudios previos y teorías probadas, en ello la progresión a menudo no es lineal.

Muchos estudios científicos buscan medir, explicar y hacer predicciones sobre fenómenos naturales, en tanto otros estudios buscan detectar y medir los efectos de una intervención en un sistema. La inferencia estadística proporciona un marco conceptual y computacional para abordar las preguntas científicas en cada entorno.

La estimación y prueba de hipótesis, son amplias mutualidades de procedimientos inferenciales, la estimación es adecuada para entornos en los que, el objetivo principal es la evaluación de la magnitud de una cantidad, como una medida de una constante física o la tasa de cambio en una respuesta, correspondiente a un cambio en una variable explicativa. La prueba de hipótesis es adecuada para entornos en los que el interés científico se centra en el posible efecto de un evento natural o intervención intencional, y se realiza un estudio para evaluar la evidencia a favor y en contra de este efecto.

En este contexto, la prueba de hipótesis ayuda a responder preguntas binarias; por ejemplo, ¿crecerá una planta más rápido con el fertilizante A o el fertilizante B? o ¿Un medicamento experimental funciona mejor que un placebo?, se utilizan varios tipos de métodos estadísticos más especializados en la investigación científica, debido a que las pruebas de hipótesis han estado involucradas en una parte importante de las evaluaciones de reproducibilidad y replicabilidad, que considera este modo de inferencia estadística con cierto detalle. Sin embargo, las consideraciones de reproducibilidad y replicabilidad se aplican ampliamente a otros modos y tipos de inferencia estadística, así por ejemplo, la cuestión de extraer múltiples inferencias estadísticas de los mismos datos es relevante para todas las pruebas de hipótesis y en la estimación.

Los estudios que involucran pruebas de hipótesis generalmente involucran muchos factores, que pueden introducir variaciones en los resultados. Algunos de estos factores se reconocen y otros no, así la asignación aleatoria de sujetos u objetos de prueba a uno u otro de los grupos de comparación es una forma de controlar la posible influencia de fuentes de variación no reconocidas y reconocidas; la asignación aleatoria puede ayudar a evitar diferencias sistemáticas entre los grupos que se comparan, pero no afecta la variación inherente en el sistema (por ejemplo, población o una intervención) en el estudio.

Los científicos e investigadores, usan el término hipótesis nula, para describir la suposición de que no hay diferencia, entre los dos grupos de intervención o ningún efecto de un tratamiento en algún resultado medido (Fisher, 1935). Una formulación de prueba de hipótesis comúnmente utilizada se basa en la respuesta a la siguiente pregunta: si la hipótesis nula es verdadera, ¿cuál es la probabilidad de obtener una diferencia al menos tan grande como la observada?, en general, cuanto mayor es la diferencia observada, menor es la probabilidad de que se obtenga una diferencia al menos tan grande como la observada, cuando la hipótesis nula es verdadera, esta probabilidad de obtener una diferencia al menos tan grande como la observada, cuando la hipótesis nula es verdadera se denomina "valor p"; como se interpreta tradicionalmente, si un p calculado-valor es menor, que un umbral definido, los resultados pueden considerarse estadísticamente significativos,  así un umbral típico puede ser p ≤ 0.05 o, más estrictamente, p ≤ 0.01 o p ≤ 0.005.

En una declaración emitida en 2016, la Junta de la Asociación Americana de Estadística (Wasserstein y Lazar, 2016, p. 129) señaló: “Si bien el valor p puede ser una medida estadística útil, comúnmente se usa mal y se malinterpreta”, esto ha llevado a que algunas revistas científicas desalienten el uso de los valores p, y algunos científicos y estadísticos recomiendan su abandono, con algunos argumentos esencialmente sin cambios desde la introducción de los valores p.

Más recientemente, se ha argumentado que los valores p, debidamente calculados y entendidos, pueden ser informativos y útiles; sin embargo, una conclusión de significancia estadística basada en un umbral de probabilidad arbitraria (incluso uno familiar como p ≤ 0.05) es inútil y frecuentemente engañoso (Wasserstein et al., 2019; Amrhein et al., 2019).

Comentarios

Entradas populares de este blog

Metodología