Desde los aspectos históricos, conceptos fundamentales, herramientas y modelos grandes del lenguaje aplicado al campo médico

Quienes Somos

Servicios

ProfundaMente

Contacto

FAQ

El uso de la Inteligencia Artificial en el Análisis Estadístico de Resultados en Investigación en Salud

By

·

6–10 minutos

Introducción

El análisis estadístico es una piedra angular en la investigación en salud, fundamental para validar hipótesis, interpretar hallazgos y comunicar resultados confiables. Sin embargo, el creciente volumen y complejidad de los datos biomédicos ha impuesto desafíos significativos, especialmente para investigadores sin formación avanzada en estadística o programación. En este contexto, la inteligencia artificial (IA) —particularmente los modelos de lenguaje como ChatGPT con capacidades de interpretación de código— ha comenzado a jugar un rol transformador al asistir en el análisis estadístico de resultados de investigación.

Asistencia de la IA en el Análisis Estadístico: Capacidades Emergentes

Herramientas basadas en modelos como ChatGPT han demostrado ser útiles para una amplia gama de tareas vinculadas al análisis estadístico, que abarcan desde la gestión inicial de datos (como limpieza, transformación y recodificación), la generación de estadísticas descriptivas (medias, medianas, desviaciones estándar, tablas de frecuencia), hasta la ejecución de pruebas estadísticas inferenciales con su correspondiente interpretación. Este conjunto de capacidades permite a los investigadores interactuar con grandes volúmenes de datos mediante lenguaje natural, lo que simplifica significativamente los flujos de trabajo tradicionales que requerían habilidades de programación avanzadas o el uso de software especializado.

Según el estudio realizado por Ruta et al. (2025), ChatGPT, al utilizar la herramienta Code Interpreter, logró ejecutar correctamente análisis estadísticos univariados con una precisión superior al 90% siempre que las instrucciones (prompts) proporcionadas fueran formuladas de manera clara, específica y con conocimiento de los datos involucrados. En ese estudio se evaluó su desempeño con pruebas comunes en investigación en salud, incluyendo t-tests, análisis de varianza (ANOVA), correlaciones de Pearson y Spearman, pruebas no paramétricas como Mann-Whitney y Kruskal-Wallis, y pruebas de independencia como chi-cuadrado. Estos resultados muestran no solo la capacidad del modelo para ejecutar cálculos, sino también para interpretar supuestos, validar decisiones analíticas y presentar resultados en lenguaje técnico y comprensible.

Figura. Generada automáticamente con GPT 4o.

Esto convierte a la inteligencia artificial en una herramienta de apoyo especialmente útil para investigadores con conocimientos intermedios en estadística, quienes pueden utilizar el sistema como guía para preparar análisis preliminares, validar hipótesis, explorar relaciones entre variables y redactar secciones de métodos y resultados en sus informes o artículos científicos. También abre la puerta a la democratización del análisis estadístico en contextos donde el acceso a consultoría estadística profesional es limitado, como en instituciones con restricciones presupuestarias o regiones con escasez de profesionales especializados. Esta accesibilidad, sin embargo, requiere el desarrollo de habilidades en redacción de prompts, interpretación crítica de los resultados y comprensión de los principios estadísticos que rigen cada técnica utilizada, lo cual puede integrarse como parte de la formación en investigación.

Casos de Uso en Investigación Biomédica

En investigaciones clínicas y epidemiológicas, la IA puede asistir en múltiples etapas del análisis estadístico, actuando como un aliado clave para investigadores de diversas disciplinas:

  • Preparación de bases de datos: Incluye tareas como la limpieza automatizada de valores faltantes, la imputación por métodos estadísticos o de aprendizaje automático, y la recodificación de variables categóricas o numéricas según los requisitos del análisis.
  • Generación de estadísticas descriptivas: Cálculo automatizado de medidas como la media, mediana, moda, desviación estándar, percentiles y rangos intercuartílicos, así como la elaboración de tablas de frecuencias para variables categóricas y mixtas.
  • Selección y ejecución de pruebas estadísticas: La IA puede sugerir pruebas adecuadas (paramétricas o no paramétricas) con base en los supuestos del análisis y ejecutar pruebas como t-test, ANOVA, chi-cuadrado, correlaciones o regresiones, explicando la elección y los criterios empleados.
  • Interpretación automatizada de resultados: Redacción preliminar de secciones de resultados en artículos científicos, incluyendo interpretación textual de valores p, intervalos de confianza y tamaño del efecto, contextualizados en el marco de la hipótesis del estudio.
  • Visualización estadística: Generación de gráficos como histogramas, diagramas de caja, diagramas de dispersión, gráficos de barras o mapas de calor para facilitar la comprensión de patrones y relaciones en los datos.

Adicionalmente, estas herramientas pueden identificar alertas metodológicas, como la aplicación de pruebas paramétricas sobre datos que no cumplen los supuestos de normalidad, la presencia de outliers, errores de codificación o desequilibrios en los grupos comparados. En este sentido, actúan como asistentes metodológicos interactivos que complementan el razonamiento del investigador, promoviendo una práctica más reflexiva y rigurosa del análisis estadístico. Además, su capacidad de explicar errores detectados y sugerir correcciones fortalece el aprendizaje continuo y eleva el estándar de calidad en la investigación aplicada.

Limitaciones y Recomendaciones

Aunque prometedoras, estas capacidades requieren una utilización cuidadosa y una comprensión clara de sus limitaciones. La precisión de los análisis generados por inteligencia artificial depende en gran medida de la calidad del prompt inicial proporcionado por el usuario, así como de su capacidad para interpretar adecuadamente los resultados obtenidos. La IA no reemplaza el criterio estadístico experto, y puede cometer errores que pasen inadvertidos si no se lleva a cabo una revisión crítica. Entre los errores más comunes se encuentran la selección incorrecta de pruebas estadísticas, la interpretación errónea de resultados debido a ambigüedades en los comandos y la aplicación de métodos sin verificación de los supuestos necesarios, como la normalidad, la homocedasticidad o la independencia de las observaciones.

Adicionalmente, algunos modelos pueden aplicar correcciones automáticas (como el ajuste de Yates en pruebas de chi-cuadrado) sin indicarlo claramente, lo que puede alterar los resultados esperados si el investigador no conoce en detalle los parámetros usados por la herramienta. También puede ocurrir que se realicen inferencias estadísticas sin una adecuada visualización previa de los datos o sin comprobar la existencia de valores atípicos, lo cual compromete la validez de los análisis.

Por lo tanto, se recomienda:

  • Redactar prompts detallados que incluyan el tipo y escala de las variables, la hipótesis a contrastar, el contexto del estudio y los supuestos estadísticos relevantes.
  • Repetir cada análisis al menos tres veces, variando levemente los comandos, para verificar consistencia en los resultados.
  • Validar todos los análisis con herramientas estadísticas tradicionales (R, SPSS, STATA) o mediante revisión con un profesional capacitado en bioestadística.
  • Documentar rigurosamente el uso de IA en cada etapa del análisis, incluyendo los prompts utilizados, versiones del modelo y cualquier ajuste realizado.

Figura. Generada automáticamente con GPT 4o.

Este enfoque no solo mejora la reproducibilidad del trabajo, sino que también permite evaluar de forma transparente la influencia de la IA en el proceso de análisis, fortaleciendo la calidad metodológica del estudio.

Integración en la Formación y la Práctica

La integración de la inteligencia artificial en el análisis estadístico no solo tiene el potencial de acelerar significativamente el ritmo del trabajo académico, sino también de mejorar de forma sustancial la formación de investigadores en áreas metodológicas. Chatbots con capacidades estadísticas, como ChatGPT con Code Interpreter, pueden actuar como tutores virtuales que acompañan a estudiantes y profesionales durante todo el proceso analítico. Estas herramientas son capaces de explicar conceptos estadísticos complejos con un lenguaje accesible, ofrecer ejemplos prácticos personalizados, sugerir pruebas estadísticas apropiadas según el diseño del estudio, y ayudar a interpretar resultados en función del contexto de la investigación.

Figura. Generada automáticamente con GPT 4o.

Este tipo de asistencia puede ser particularmente valiosa en programas de formación de pregrado y posgrado en ciencias de la salud, donde muchas veces los cursos de estadística se ven como barreras difíciles de superar. Con IA, los estudiantes pueden recibir explicaciones instantáneas, aclarar dudas en tiempo real y practicar mediante simulaciones guiadas. Además, fomenta la autonomía y el pensamiento crítico al brindar retroalimentación inmediata sobre errores comunes o suposiciones incorrectas.

A nivel institucional, plataformas como ChatGPT pueden incorporarse de forma estratégica como asistentes digitales en centros de investigación, universidades y hospitales universitarios. Su uso es especialmente útil durante las fases iniciales de proyectos, cuando los investigadores aún están definiendo sus preguntas y preparando bases de datos. También pueden emplearse como una primera etapa de exploración analítica antes de acudir al apoyo de un bioestadístico, optimizando así el tiempo y los recursos disponibles. En contextos de revisión de literatura, estas herramientas pueden generar resúmenes estadísticos de artículos previos, comparar métodos utilizados o detectar lagunas metodológicas en estudios similares, lo cual fortalece la calidad y enfoque de nuevas investigaciones.

Conclusión

La inteligencia artificial, especialmente los modelos de lenguaje con capacidad de interpretar código, está emergiendo como una herramienta potente para asistir el análisis estadístico de resultados de investigación en salud. Su uso responsable, con supervisión experta y dentro de un marco ético y metodológico riguroso, tiene el potencial de ampliar el acceso al análisis estadístico de calidad, acelerar la producción científica y mejorar la comprensión de los hallazgos. En la medida en que evolucione esta tecnología, será esencial que investigadores y docentes aprendan a integrarla críticamente en su práctica cotidiana.

Referencias:

  1. Ruta MR, Gaidici T, Irwin C, Lifshitz J. ChatGPT for Univariate Statistics: Validation of AI-Assisted Data Analysis in Healthcare Research. J Med Internet Res. 2025;27:e63550. doi:10.2196/63550.
  2. Wang L, Ge X, Liu L, Hu G. Code Interpreter for Bioinformatics: Are We There Yet? Ann Biomed Eng. 2024;52(4):754-756. doi:10.1007/s10439-023-03324-9.
  3. Ahn S. Data Science through Natural Language with ChatGPT’s Code Interpreter. Transl Clin Pharmacol. 2024;32(2):73-82. doi:10.12793/tcp.2024.32.e8.
  4. Nordling L. How ChatGPT is transforming the postdoc experience. Nature. 2023;622(7971):655–657. doi:10.1038/d41586-023-03235-8.
  5. Tu X, Zou J, Su WJ, Zhang L. What Should Data Science Education Do with Large Language Models? Just Accepted. Harv Data Sci Rev. 2024. doi:10.1162/99608f92.bff007ab.

Deja un comentario