DEFINICIÓN DE REPLICABILIDAD Y REPRODUCIBILIDAD
Primera Parte
Diferentes disciplinas e instituciones científicas usan las
palabras replicabilidad y reproducibilidad de manera inconsistente o incluso
contradictoria, lo que un grupo científico quiere decir con una palabra, el
otro grupo quiere decir con la otra palabra.
Estos términos, y otros, como la repetibilidad, se han
utilizado durante mucho tiempo en relación con el concepto general de un
experimento o estudio que confirma los resultados de otro.
Dentro de este concepto general, sin embargo, no ha surgido
ninguna forma terminológicamente consistente de hacer distinciones; en cambio,
han florecido términos contradictorios e inconsistentes.
Las dificultades para evaluar la replicabilidad y la
reproducibilidad, se complican por la ausencia de definiciones estándar para
estos términos.
En algunos campos, se ha utilizado un término para cubrir todos
los conceptos relacionados, por ejemplo, la "replicación" cubrió
históricamente todas las preocupaciones en ciencias políticas según King (1995).
En muchos entornos, los términos replicable y reproducible tienen
significados distintos, pero diferentes comunidades adoptaron definiciones
opuestas, según Claerbout y Karrenbach (1992) Peng et al. (2006) en Association
for Computing Machinery (2018).
Algunos han agregado términos calificativos, como la
reproducibilidad de métodos, la reproducibilidad de resultados y la reproducibilidad
inferencial al léxico según Goodman et al. (2016)
En particular, ha surgido tensión entre el uso recientemente
adoptado en informática y la forma en que para el caso negativo, tanto "no
reproducible" como "irreproducible" se utilizan en el trabajo
científico y son sinónimos.
En un documento de revisión sobre el uso de los términos
reproducibilidad y replicabilidad, según Barba (2018), quien describió tres
categorías de uso, que caracterizó como A, B1 y B2:
A: Los términos se usan sin distinción entre ellos.
B1: "Reproducibilidad" se refiere a instancias en
las que los datos del investigador original y los códigos de computadora se
utilizan para regenerar los resultados, mientras que "replicabilidad"
se refiere a instancias en las que un investigador recopila datos nuevos para
llegar a los mismos hallazgos científicos que en un estudio anterior.
B2: "Reproducibilidad" se refiere a investigadores
independientes que llegan a los mismos resultados utilizando sus propios datos
y métodos, mientras que "replicabilidad" se refiere a un equipo
diferente que llega a los mismos resultados utilizando los artefactos del autor
original.
B1 y B2 se oponen entre sí con respecto a qué término
implica la reutilización de los artefactos digitales de investigación de los
autores originales ("compendio de investigación") y que implica
artefactos digitales creados de forma independiente.
Barba (2018) recopiló datos sobre el uso de estos términos
en una variedad de disciplinas, pero independientemente de los términos
específicos utilizados, los conceptos subyacentes han desempeñado durante mucho
tiempo papeles esenciales en todas las disciplinas científicas.
Estos conceptos están estrechamente relacionados con las
siguientes preguntas generales sobre resultados científicos:
1.
¿Se presentan los datos y el análisis con
suficiente transparencia y claridad para poder verificar los resultados?
2.
Si se marca, ¿los datos y el análisis que se
ofrecen para respaldar el resultado respaldan de hecho ese resultado?
3.
Si se muestra que los datos y el análisis
respaldan el resultado original, ¿se puede encontrar nuevamente el resultado
informado en el contexto de estudio específico investigado?
4.
¿Se puede encontrar nuevamente el resultado
informado o la inferencia extraída en un conjunto más amplio de contextos de
estudio?
Los científicos computacionales generalmente usan el término
reproducibilidad para responder solo a la primera pregunta, es decir, la
investigación reproducible es una investigación que puede verificarse porque
los datos, el código y los métodos de análisis están disponibles para otros
investigadores.
El término reproducibilidad también se puede usar en el
contexto de la segunda pregunta: la investigación es reproducible si otro
investigador realmente usa los datos y el código disponibles y obtiene los
mismos resultados.
La diferencia entre la primera y la segunda pregunta es la
acción de otro investigador; el primero se refiere a la disponibilidad de los
datos, el código y los métodos de análisis, mientras que el segundo se refiere
al acto de volver a calcular los resultados utilizando los datos, el código y
los métodos de análisis disponibles.
Para responder las preguntas primera y segunda, un segundo
investigador usa datos y código de la primera; el segundo investigador no crea
datos o códigos nuevos.
La reproducibilidad depende solo de si los métodos del
análisis computacional se informaron de forma transparente y precisa y si esos
datos, código u otros materiales se utilizaron para reproducir los resultados
originales.
En contraste, para responder la pregunta tres, un
investigador debe rehacer el estudio, siguiendo los métodos originales lo más
cerca posible y recolectando datos nuevos.
Para responder a la pregunta cuatro, un investigador podría
tomar una variedad de caminos: elegir una nueva condición de análisis, realizar
el mismo estudio en un nuevo contexto o realizar un nuevo estudio dirigido a la
misma pregunta de investigación o similar.
Visita mi artículo sobre Precisión de Medición en Observaciones Científicas
Comentarios
Publicar un comentario