PRUEBAS DE INFERENCIA ESTADÍSTICA E HIPÓTESIS
A medida que los investigadores exploran el mundo a través
de nuevos estudios y observaciones científicas, la evidencia puede desafiar las
teorías existentes. El proceso científico permite implicar revisiones o cambios
en la comprensión actual.
La prueba de los modelos y teorías existentes a través de la
recopilación de datos nuevos es útil para establecer su preponderancia así como
sus límites (es decir, su capacidad de generalización) y en última instancia,
ese proceso es inevitable a medida que los científicos e investigadores,
desarrollan mejores métodos para evaluar y observar en el proceso de expansión del
conocimiento.
El advenimiento del nuevo conocimiento científico, que
desplaza o replantea el conocimiento previo no debe interpretarse como una
debilidad en la ciencia. El conocimiento científico se basa en estudios previos
y teorías probadas, en ello la progresión a menudo no es lineal.
Muchos estudios científicos buscan medir, explicar y hacer
predicciones sobre fenómenos naturales, en tanto otros estudios buscan detectar
y medir los efectos de una intervención en un sistema. La inferencia
estadística proporciona un marco conceptual y computacional para abordar las
preguntas científicas en cada entorno.
La estimación y prueba de hipótesis, son amplias mutualidades
de procedimientos inferenciales, la estimación es adecuada para entornos en los
que, el objetivo principal es la evaluación de la magnitud de una cantidad,
como una medida de una constante física o la tasa de cambio en una respuesta,
correspondiente a un cambio en una variable explicativa. La prueba de hipótesis
es adecuada para entornos en los que el interés científico se centra en el
posible efecto de un evento natural o intervención intencional, y se realiza un
estudio para evaluar la evidencia a favor y en contra de este efecto.
En este contexto, la prueba de hipótesis ayuda a responder
preguntas binarias; por ejemplo, ¿crecerá una planta más rápido con el
fertilizante A o el fertilizante B? o ¿Un medicamento experimental funciona
mejor que un placebo?, se utilizan varios tipos de métodos estadísticos más
especializados en la investigación científica, debido a que las pruebas de
hipótesis han estado involucradas en una parte importante de las evaluaciones
de reproducibilidad y replicabilidad, que considera este modo de inferencia
estadística con cierto detalle. Sin embargo, las consideraciones de
reproducibilidad y replicabilidad se aplican ampliamente a otros modos y tipos
de inferencia estadística, así por ejemplo, la cuestión de extraer múltiples
inferencias estadísticas de los mismos datos es relevante para todas las
pruebas de hipótesis y en la estimación.
Los estudios que involucran pruebas de hipótesis
generalmente involucran muchos factores, que pueden introducir variaciones en
los resultados. Algunos de estos factores se reconocen y otros no, así la
asignación aleatoria de sujetos u objetos de prueba a uno u otro de los grupos
de comparación es una forma de controlar la posible influencia de fuentes de
variación no reconocidas y reconocidas; la asignación aleatoria puede ayudar a
evitar diferencias sistemáticas entre los grupos que se comparan, pero no
afecta la variación inherente en el sistema (por ejemplo, población o una
intervención) en el estudio.
Los científicos e investigadores, usan el término hipótesis
nula, para describir la suposición de que no hay diferencia, entre los dos
grupos de intervención o ningún efecto de un tratamiento en algún resultado
medido (Fisher, 1935). Una formulación de prueba de hipótesis comúnmente
utilizada se basa en la respuesta a la siguiente pregunta: si la hipótesis nula
es verdadera, ¿cuál es la probabilidad de obtener una diferencia al menos tan
grande como la observada?, en general, cuanto mayor es la diferencia observada,
menor es la probabilidad de que se obtenga una diferencia al menos tan grande
como la observada, cuando la hipótesis nula es verdadera, esta probabilidad de
obtener una diferencia al menos tan grande como la observada, cuando la
hipótesis nula es verdadera se denomina "valor p"; como se
interpreta tradicionalmente, si un p calculado-valor es menor, que un umbral
definido, los resultados pueden considerarse estadísticamente significativos, así
un umbral típico puede ser p ≤ 0.05 o, más estrictamente, p ≤ 0.01 o p ≤ 0.005.
En una declaración emitida en 2016, la Junta de la Asociación
Americana de Estadística (Wasserstein y Lazar, 2016, p. 129) señaló: “Si bien
el valor p puede ser una medida estadística útil, comúnmente se usa mal y se
malinterpreta”, esto ha llevado a que algunas revistas científicas desalienten
el uso de los valores p, y algunos científicos y estadísticos recomiendan su
abandono, con algunos argumentos esencialmente sin cambios desde la
introducción de los valores p.
Más recientemente, se ha argumentado que los
valores p, debidamente calculados y entendidos, pueden ser informativos y
útiles; sin embargo, una conclusión de significancia estadística basada en un
umbral de probabilidad arbitraria (incluso uno familiar como p ≤ 0.05) es
inútil y frecuentemente engañoso (Wasserstein et al., 2019; Amrhein et al., 2019).
Comentarios
Publicar un comentario