El auge de los modelos de IA de código abierto y su impacto global

Desde la introducción de DeepSeek en enero, el interés por los modelos de inteligencia artificial (IA) de código abierto provenientes de China ha aumentado notablemente. Este movimiento cobra fuerza a medida que los investigadores abogan por un enfoque más inclusivo en el desarrollo de IA, uno que fomente contribuciones de personas de todo el mundo.

Prime Intellect, una innovadora startup en el ámbito de la IA descentralizada, está en proceso de entrenar un modelo de lenguaje de gran envergadura conocido como INTELLECT-3.

Este modelo utiliza una forma novedosa de aprendizaje por refuerzo distribuido para su ajuste fino, lo que permite la construcción única de modelos de IA competitivos de código abierto en diversas plataformas de hardware a nivel global, independientemente de las grandes corporaciones tecnológicas, según señala Vincent Weisser, CEO de Prime Intellect.

Un puente en el desarrollo de IA

Weisser señala que el panorama de la IA está esencialmente dividido: un lado depende de modelos propietarios de Estados Unidos, mientras que el otro se inclina hacia alternativas chinas de código abierto.

La tecnología que está desarrollando Prime Intellect busca democratizar la IA, permitiendo a más personas crear y mejorar sistemas avanzados de IA adaptados a sus necesidades.

La evolución de los métodos de entrenamiento de IA

Mejorar los modelos de IA hoy en día va más allá de simplemente aumentar el volumen de datos de entrenamiento y la potencia computacional. Los modelos de vanguardia están incorporando aprendizaje por refuerzo después del entrenamiento inicial para potenciar sus capacidades.

Por ejemplo, si se desea perfeccionar las habilidades matemáticas de un modelo o su capacidad para participar en discursos legales, el modelo puede mejorar a través de la práctica en un entorno controlado donde se pueden cuantificar el éxito y el fracaso.

“Estos entornos de aprendizaje por refuerzo se han convertido en la barrera crítica para escalar las capacidades de la IA de manera efectiva,” explica Weisser.

Para abordar este desafío, Prime Intellect ha ideado un marco que permite a cualquier persona construir un entorno de aprendizaje por refuerzo personalizado para tareas específicas.

Al combinar los mejores entornos creados tanto por su equipo como por la comunidad en general, están optimizando el entrenamiento de INTELLECT-3.

Durante una demostración, interactué con un entorno diseñado para resolver acertijos de Wordle, creado por el investigador de Prime Intellect, Will Brown. Observé cómo un modelo más pequeño abordaba estos acertijos con un enfoque metódico, superando mis propios intentos. Como investigador de IA, configuraría numerosas GPU, permitiendo que el modelo practicara repetidamente mientras un algoritmo de aprendizaje por refuerzo ajustaba sus parámetros, transformándolo en un experto en Wordle.

Empoderando startups y fomentando la innovación

Aunque la importancia del aprendizaje por refuerzo es innegable, gran parte de la innovación en este ámbito está actualmente limitada a grandes empresas de IA. Este proceso a menudo es complejo y requiere una experiencia considerable, lo que lo hace inaccesible para muchas pequeñas empresas y desarrolladores independientes. Weisser cree que empoderar a las startups para que participen en su propio aprendizaje por refuerzo podría conducir a la creación de productos de software impactantes, incluidos agentes especializados en diversas tareas.

Respaldo de expertos de la industria

Algunos líderes de la industria comparten este sentir. Andrej Karpathy, quien fue líder de la división de IA de Tesla, elogió la iniciativa de Prime Intellect, refiriéndose a sus entornos de aprendizaje por refuerzo como “un esfuerzo y concepto encomiables.” Instó a los investigadores de código abierto a aprovechar estos entornos, adaptándolos a nuevos desafíos para mejorar las capacidades de los modelos avanzados.

Prime Intellect ya está demostrando que las metodologías distribuidas—como segmentar cálculos e integrarlos posteriormente en un modelo unificado—pueden desafiar efectivamente las estrategias de desarrollo de IA tradicionales. A finales de 2024, introdujeron INTELLECT-1, un modelo con 10 mil millones de parámetros entrenado utilizando hardware distribuido. En marzo, la compañía lanzó INTELLECT-2, un modelo más potente que incorpora habilidades de razonamiento a través del aprendizaje por refuerzo distribuido.

El panorama cambiante de la IA

Prime Intellect, una innovadora startup en el ámbito de la IA descentralizada, está en proceso de entrenar un modelo de lenguaje de gran envergadura conocido como INTELLECT-3. Este modelo utiliza una forma novedosa de aprendizaje por refuerzo distribuido para su ajuste fino, lo que permite la construcción única de modelos de IA competitivos de código abierto en diversas plataformas de hardware a nivel global, independientemente de las grandes corporaciones tecnológicas, según señala Vincent Weisser, CEO de Prime Intellect.0