OpenAI, la empresa creadora del popular ChatGPT, presentó este viernes OpenAI o1, el primer modelo de inteligencia artificial (IA) de su serie capaz de “razonar” y “pensar” sus respuestas a través de las matemáticas y la ciencia para así cometer menos errores.
“Entrenamos estos modelos para que dediquen más tiempo a pensar en los problemas antes de responder, de manera muy similar a lo que lo haría una persona. A través del entrenamiento, aprenden a refinar su proceso de pensamiento, probar diferentes estrategias y reconocer sus errores”, explicó la empresa en un comunicado publicado el jueves.
Hasta ahora, OpenAI había enseñado a sus modelos a imitar patrones de sus datos de entrenamiento tomando como base muchas veces la información que está en internet, pero como la red está llena de información falsa, la tecnología aprendió a repetir las mismas informaciones erróneas.
No obstante, o1 usa una técnica conocida como aprendizaje de refuerzo, que enseña al sistema a través de recompensas y penalizaciones.
En tanto, al resolver varios problemas matemáticos, por ejemplo, puede aprender qué métodos conducen a la respuesta correcta y cuáles no.
Como resultado de esta nueva metodología de entrenamiento, OpenAI dice que el modelo debería ser más preciso y evitar así las “alucinaciones” “cuando da respuestas bien estructuradas, pero falsas”, según dijo el líder de investigación de OpenAI, Jerry Tworek al medio especializado The Verge.
En una demostración para The New York Times, OpenAI mostró al chatbot mientras resolvía un acróstico (un complejo rompecabezas de palabras), respondía a una pregunta de química de nivel de doctorado y diagnosticaba una enfermedad basándose en un informe detallado sobre los síntomas y el historial de un paciente.