La inteligencia artificial (IA) ha avanzado significativamente desde sus orígenes. Sin embargo, a menudo es percibida como un simple imitador de las capacidades humanas. Tradicionalmente, estos modelos se alimentan de ejemplos y problemas establecidos por instructores. Pero un enfoque innovador propone que la IA podría aprender de manera más similar a los humanos, formulando sus propias preguntas y resolviendo problemas.
Un equipo de investigación de la Universidad de Tsinghua, junto con el Instituto de Inteligencia Artificial General de Pekín (BIGAI) y la Universidad Estatal de Pensilvania, ha creado un sistema llamado Absolute Zero Reasoner (AZR).
Este sistema es capaz de generar problemas de programación en Python que son desafiantes pero solucionables, permitiendo así que la IA aprenda a plantear y resolver problemas.
El proceso de aprendizaje autónomo
El AZR utiliza un modelo de lenguaje avanzado que no solo genera problemas, sino que también intenta resolverlos y valida su trabajo ejecutando el código. A través de este método, la IA se ajusta y mejora continuamente, utilizando tanto sus éxitos como sus fracasos como indicadores de desempeño.
Este enfoque ha demostrado ser efectivo, mejorando las habilidades de razonamiento y programación en modelos de código abierto como Qwen, que cuenta con 7 y 14 mil millones de parámetros.
Más allá de la imitación
Andrew Zhao, estudiante de doctorado en Tsinghua y uno de los creadores del AZR, señala que este método de aprendizaje se asemeja a cómo los humanos evolucionan más allá de la simple memorización o imitación.
Zhao explica: «Al principio, imitas a tus padres y sigues a tus maestros, pero eventualmente te ves obligado a formular tus propias preguntas». Este proceso de autoexploración es fundamental para superar a aquellos que te enseñaron en el pasado.
Este concepto de autoaprendizaje, a menudo denominado auto-juego, ha sido investigado previamente por pioneros en el campo de la IA como Jürgen Schmidhuber y Pierre-Yves Oudeyer. La capacidad de la IA para escalar en dificultad a medida que mejora es una de las características más prometedoras de este enfoque.
Desafíos y perspectivas futuras
A pesar de los avances, el AZR enfrenta limitaciones, ya que actualmente solo puede abordar problemas que son fácilmente verificables, como los matemáticos o de programación. Sin embargo, a medida que el proyecto avanza, podría expandirse a tareas más complejas, como navegar por la web o realizar tareas administrativas. Esto incluye el desarrollo de la capacidad de la IA para evaluar la corrección de las acciones de un agente.
Un futuro de inteligencia superior
Una de las perspectivas más fascinantes del enfoque de Absolute Zero es su potencial para llevar a modelos de IA más allá de lo que los humanos pueden enseñar. Zheng, un investigador de BIGAI, menciona que «una vez que alcanzamos esto, es un camino hacia la superinteligencia«. Este tipo de aprendizaje autónomo podría revolucionar el campo de la IA.
Ya existen indicios de que el enfoque del AZR está siendo adoptado por importantes laboratorios de IA. Proyectos como Agent0, en colaboración con Salesforce, Stanford y la Universidad de Carolina del Norte en Chapel Hill, demuestran que el auto-juego también se utiliza para mejorar el razonamiento general a través de la resolución experimental de problemas.
En un contexto donde las fuentes de datos tradicionales son cada vez más escasas y costosas, buscar nuevas metodologías de aprendizaje como el AZR se convierte en un tema crucial en la industria tecnológica. La meta es crear sistemas de IA que se asemejen menos a meros imitadores y más a seres que piensan y resuelven problemas como los humanos.


