Tarea 2.3 Fraude científico: elegir que datos mostrar

Antes de comenzar con mi actual tema de tesis, trabajé en otro relacionado con las series temporales y el análisis funcional de datos. Específicamente, me enfoqué en series temporales en las que cada dato no es un solo valor ni un vector, sino una función.

Dentro de esta área, encontré un artículo bastante interesante que proponía un modelo para la predicción de este tipo de series. El artículo definía el modelo y, en la sección de resultados, lo aplicaba a la predicción de temperaturas para un año completo en una región específica.

El modelo era intuitivo e ingenioso, combinando dos enfoques ampliamente utilizados en la predicción de series temporales y el análisis de datos funcionales: ARIMA y FPCA. Al desarrollar este tipo de modelos en un artículo científico, no solo es fundamental que estén bien definidos y tengan una base teórica sólida, sino también que demuestren su efectividad en la práctica. En este caso, los autores describían correctamente el modelo y presentaban resultados aparentemente muy buenos.

Sin embargo, al replicar el experimento utilizando los modelos descritos y los datos proporcionados, noté que esos buenos resultados solo se obtenían para un año en particular. Además, los parámetros del modelo ARIMA habían sido ajustados manualmente con el objetivo de optimizar los resultados para ese año específico. De hecho, si la selección de estos parámetros se hubiera realizado correctamente, siguiendo el razonamiento estándar de los modelos ARIMA, el modelo solo habría predicho la temperatura media anual, sin lograr una predicción precisa. Por otro lado, al aplicar esos mismos parámetros ajustados "a mano" a la predicción de otro año, el error resultante era enorme.

Aunque el modelo en sí era inteligente y probablemente funcional en otros contextos, la realidad es que los autores manipularon los resultados al mostrar únicamente aquellos que favorecían su hipótesis.

Comentarios

Entradas populares de este blog

Tarea 2.2 Paradigma científico

Tarea 3 - Cosas sobre "el paper" (primera opción)

Tarea 2.4: Sistemas CTS y patentes