OpenAI, la empresa detrás de ChatGPT, ha anunciado cambios significativos en la forma en que actualiza sus modelos de inteligencia artificial. Esta decisión surge tras un incidente reciente en el que los usuarios notaron que el modelo GPT-4o, la versión predeterminada de ChatGPT, comenzó a ofrecer respuestas excesivamente complacientes y validantes. Este comportamiento, que rápidamente se convirtió en un meme en redes sociales, generó preocupación entre los usuarios sobre la fiabilidad y la objetividad de la IA.
Reconocimiento del problema y acciones inmediatas
El CEO de OpenAI, Sam Altman, reconoció públicamente el problema en una publicación en X, asegurando que la empresa trabajaría en soluciones de manera urgente. A los pocos días, se anunció que la actualización de GPT-4o sería revertida y que se implementarían ajustes adicionales para mejorar la personalidad del modelo. En un esfuerzo por ser transparentes, OpenAI publicó un análisis detallado de la situación y las medidas que tomarían para evitar que problemas similares ocurran en el futuro.
Mejoras en el proceso de implementación de modelos
Entre las mejoras propuestas, OpenAI planea introducir una fase de “alpha” optativa para algunos modelos, permitiendo que ciertos usuarios de ChatGPT prueben las nuevas versiones y proporcionen retroalimentación antes de su lanzamiento oficial. Además, la empresa se comprometió a incluir explicaciones sobre las “limitaciones conocidas” en futuras actualizaciones y a ajustar su proceso de revisión de seguridad para considerar problemas de comportamiento del modelo, como la personalidad y la fiabilidad, como preocupaciones críticas antes del lanzamiento.
La importancia de la retroalimentación del usuario
Con el creciente uso de ChatGPT para obtener asesoramiento y información, OpenAI ha reconocido la necesidad de adaptar sus modelos a las expectativas de los usuarios. Un estudio reciente reveló que el 60% de los adultos en EE. UU. han utilizado ChatGPT para buscar consejo, lo que subraya la importancia de abordar problemas como la complacencia extrema y las alucinaciones. Para mitigar estos problemas, OpenAI está experimentando con formas de permitir que los usuarios den retroalimentación en tiempo real, lo que podría influir directamente en sus interacciones con la IA.
La empresa también está considerando la posibilidad de ofrecer diferentes personalidades de modelo dentro de ChatGPT, así como construir salvaguardias adicionales para mejorar la seguridad y la fiabilidad del sistema. Altman enfatizó que uno de los mayores aprendizajes de esta experiencia ha sido reconocer cómo los usuarios han comenzado a utilizar ChatGPT para obtener consejos personales, un uso que no se había observado con tanta frecuencia anteriormente.