• Sáb. May 4th, 2024

COLUMNA: Ciencia y Futuro

PorRedacción

Jun 23, 2023

Descubriendo el poder del aprendizaje automático para extraer tendencias y patrones de datos de encuestas

Por Pedro César Santana Mancilla*

El aprendizaje automático o Machine Learning (ML), es una técnica de inteligencia artificial que permite a las computadoras aprender y mejorar automáticamente sin necesidad de ser programadas explícitamente para cada tarea.

Existen diferentes tipos de algoritmos de ML, pero en general, su proceso implica 3 pasos:

1) Preprocesamiento de los datos: Antes de que los datos puedan ser utilizados por el ML, deben pasar por un proceso de limpieza, normalización y selección de características relevantes.

2) Entrenamiento: En esta fase, la computadora utiliza datos ya existentes para aprender patrones. La inteligencia artificial ajusta los parámetros del modelo en función de los datos de entrada para mejorar su precisión y la capacidad predictiva.

3) Pruebas: Una vez que el modelo ha sido entrenado, predice nuevos datos. Estos nuevos datos no se utilizaron en el entrenamiento, lo cual permite evaluar la precisión y su capacidad predictiva.

El ML se utiliza en diferentes campos, como en la clasificación de correos electrónicos no deseados, la predicción de la tasa de mortalidad de pacientes en hospitales, el reconocimiento de voz, el análisis de grandes cantidades de datos, entre muchos otros. Exploraremos el uso de ML para analizar datos de encuestas, por ejemplo.

Diversas disciplinas encuentran en las encuestas una técnica de investigación que permite extraer información valiosa de muestras de población. El ML se ha convertido en una herramienta poderosa para analizar datos de dichas encuestas, permitiendo la extracción de tendencias y patrones que serían difíciles de identificar utilizando métodos de análisis tradicionales. Se pueden usar diversas técnicas, como clustering, análisis de sentimientos, modelos predictivos y reducción de la dimensionalidad.

El clustering es una técnica que agrupa a los encuestados según sus respuestas a diversas preguntas. Por ejemplo, si se realiza una encuesta para conocer datos demográficos y de salud, esta técnica agrupa a los encuestados en varias categorías. El análisis de estos grupos identificados por el ML puede proporcionar información valiosa sobre las necesidades de salud de diferentes segmentos de la población y ayudar en el diseño de políticas públicas y programas de salud más efectivos.

El análisis de sentimientos es otra técnica de aprendizaje automático que se puede utilizar para comprender las opiniones generales de los encuestados sobre un tema específico. Para ilustrar, pensemos en una encuesta para evaluar las opiniones de las personas hacia la vacuna contra la gripe. El análisis de sentimientos puede analizar las respuestas para determinar si son positivas, negativas o neutrales. Si un número significativo de respuestas son negativas, indica que las personas tienen una opinión desfavorable de la vacuna contra la gripe y podrían ser necesarias campañas educativas para cambiar la percepción pública.

Los modelos predictivos se usan para predecir las respuestas a preguntas de encuestas. Por ejemplo, sobre la aceptación de una nueva dosis de alguna vacuna. Este conocimiento puede dar sustento a las estrategias de distribución de vacunas y las campañas de promoción de la vacunación para maximizar la aceptación y la cobertura de la vacuna.

La reducción de dimensionalidad simplifica el análisis de encuestas al enfocarse en las preguntas importantes para predecir respuestas específicas, lo que ayuda a identificar patrones y tendencias. En una encuesta sobre actitudes hacia políticas públicas durante una pandemia, se puede usar esta técnica para encontrar los temas principales detrás de las respuestas, esto ayudará a identificar los factores clave que explican la variación en las opiniones de los encuestados.

Al permitir una mejor comprensión de las opiniones y actitudes de los encuestados, las técnicas de aprendizaje automático han revolucionado la forma en que se analizan las encuestas y han abierto nuevas posibilidades para la identificación de patrones y tendencias en la información recolectada.

Sin embargo, es importante tener en cuenta que el uso del aprendizaje automático para analizar datos de encuestas también plantea desafíos. En particular, la calidad de los datos de entrada (incompletos, incorrectos o sesgados) puede afectar la precisión de los resultados del aprendizaje automático. Otro punto importante es tener en cuenta la ética en la recolección y análisis de datos de los participantes. El consentimiento informado es una práctica clave para garantizar que los participantes comprendan cómo se utilizarán sus datos. Además, es esencial proteger la privacidad y seguridad de los datos de la encuesta, especialmente si contienen información de identificación personal. Los algoritmos de ML también deben ser cuidadosamente evaluados para evitar sesgos injustos en los resultados.

Al aplicar aprendizaje automático ético, podemos garantizar la integridad de la investigación, podemos proteger los derechos de los participantes y ayudar a los responsables de la toma de decisiones a diseñar políticas públicas y programas más efectivos que se adapten a las necesidades y preferencias de la población.

Este artículo forma parte del trabajo realizado en el proyecto “Study of the impact, behaviors, and attitudes of the student population of the University of Colima before COVID-19”, el cual se encuentra financiado por The Norwegian Academy of Science and Letters.

*Profesor investigador de la Facultad de Telemática de la Universidad de Colima

Las opiniones expresadas en este texto periodístico de opinión, son responsabilidad exclusiva del autor y no son atribuibles a El Comentario.

Autor

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *