Explorando el auge de los modelos de IA de código abierto en China

Desde el lanzamiento de DeepSeek en enero, ha habido un notable aumento en el interés por los modelos de inteligencia artificial de código abierto chinos. Esta evolución indica un cambio en la forma en que se podría abordar el desarrollo de la IA, con defensores que abogan por un marco más global y descentralizado que fomente la participación masiva en la creación de modelos.

Entre los pioneros de este movimiento se encuentra Prime Intellect, una startup enfocada en la innovación de IA descentralizada.

La empresa está en proceso de entrenamiento de un avanzado modelo de lenguaje conocido como INTELLECT-3. Este modelo utiliza un método novedoso de aprendizaje por refuerzo distribuido para perfeccionar sus capacidades, demostrando una nueva forma de construir modelos de IA competitivos sin depender de grandes corporaciones tecnológicas.

La democratización de la IA

Vincent Weisser, CEO de Prime Intellect, destaca una división significativa en el actual panorama de la IA: un lado depende de modelos propietarios de Estados Unidos, mientras que el otro se inclina hacia las ofertas más abiertas de China.

El enfoque de Prime Intellect busca democratizar el desarrollo de la IA, permitiendo que un rango más amplio de individuos cree y ajuste tecnologías de IA sofisticadas.

Históricamente, mejorar los modelos de IA implicaba aumentar los datos de entrenamiento y la potencia computacional. Sin embargo, la frontera de la IA moderna ahora aprovecha el aprendizaje por refuerzo para refinar modelos tras el entrenamiento. Por ejemplo, si un desarrollador desea mejorar las habilidades matemáticas o de resolución de problemas de su modelo, puede establecer un entorno controlado donde el modelo pueda practicar, aprender de sus errores y lograr un mejor rendimiento.

Superando barreras

Weisser señala que las limitaciones actuales para escalar las capacidades de IA se deben principalmente a la falta de entornos de aprendizaje por refuerzo accesibles. Para abordar este problema, Prime Intellect ha desarrollado un marco que permite a cualquiera crear configuraciones de aprendizaje por refuerzo personalizadas para tareas específicas. Este enfoque novedoso combina las fortalezas de los recursos internos de la empresa y las contribuciones de la comunidad para refinar la funcionalidad de INTELLECT-3.

Por ejemplo, tuve la oportunidad de interactuar con un entorno diseñado para resolver acertijos de Wordle, creado por el investigador de Prime Intellect, Will Brown. Al observar un modelo más pequeño abordar los acertijos, me impresionó su estrategia sistemática, superando a menudo mis propios intentos. Si estuviera en la posición de un investigador de IA, desplegaría múltiples GPUs para permitir que el modelo practicara repetidamente, utilizando un algoritmo de aprendizaje por refuerzo para ajustar sus parámetros internos y, en última instancia, convertirlo en un experto de Wordle.

Los desafíos del aprendizaje por refuerzo

A pesar de la creciente importancia del aprendizaje por refuerzo, su implementación sigue estando mayormente cerrada en grandes empresas de IA, a menudo requiriendo conocimientos especializados que plantean una barrera para muchos desarrolladores y startups. Weisser argumenta que permitir a las firmas más pequeñas realizar su propio aprendizaje por refuerzo podría desbloquear una plétora de soluciones de software innovadoras, incluyendo agentes adaptados para diversas aplicaciones.

Notablemente, expertos en el campo han reconocido el potencial del marco de Prime Intellect. Andrej Karpathy, exdirector de IA en Tesla, elogió la iniciativa como un esfuerzo y una idea loables. Anima a los investigadores de código abierto a adaptar entornos existentes para nuevas tareas, mejorando así las capacidades de modelos avanzados de maneras innovadoras.

Avances recientes en IA de código abierto

Prime Intellect ya ha demostrado la efectividad de metodologías distribuidas al segmentar cálculos y amalgamarlos en un único modelo extenso. A finales de 2024, la compañía presentó INTELLECT-1, un modelo que cuenta con 10 mil millones de parámetros entrenados a través de hardware distribuido. Posteriormente, en marzo, lanzaron INTELLECT-2, que ofreció capacidades de razonamiento mejoradas mediante técnicas de aprendizaje por refuerzo distribuido.

Los últimos dos años han presenciado una transformación notable dentro del sector de la IA. El movimiento de IA de código abierto ganó impulso con el lanzamiento de la versión inicial de su modelo Llama por parte de Meta en 2023. Sin embargo, las ofertas subsiguientes de la empresa no han cumplido con las expectativas, mientras que DeepSeek, un nuevo competidor chino, captó la atención al lanzar un modelo de razonamiento de bajo costo en enero de 2025. Varios otros modelos de IA chinos han seguido este camino, llevando a una notable preferencia por estas ofertas debido a su adaptabilidad y facilidad de modificación.

Entre los pioneros de este movimiento se encuentra Prime Intellect, una startup enfocada en la innovación de IA descentralizada. La empresa está en proceso de entrenamiento de un avanzado modelo de lenguaje conocido como INTELLECT-3. Este modelo utiliza un método novedoso de aprendizaje por refuerzo distribuido para perfeccionar sus capacidades, demostrando una nueva forma de construir modelos de IA competitivos sin depender de grandes corporaciones tecnológicas.0

¿Cuál es el coste de una comunicación ineficaz? ¿Cómo se puede mejorar?

Robo de NFT en OpenSea: los hackers roban millones de activos digitales

5 tendencias de marketing digital que hay que conocer para la década

¿Falta de trabajadores? Es hora de considerar las contrataciones rápidas

Cómo Shopify está llevando a los minoristas en línea hacia el futuro

Europa, el aumento de los precios del etanol podría tener un impacto dramático en las empresas

Softbank, el director de operaciones se despide tras su enfrentamiento con el fundador Masayoshi Son

La aplicación de citas Grindr es retirada de la App Store de Apple en China

Las mayores pérdidas en el peor mes del mercado desde marzo de 2020

Lyft amplía el servicio de «asistencia» para las recogidas médicas

Esusu, una startup de crédito alcanza el estatus de unicornio

Justin Kim lanza una startup para preservar la salud mental en tiempos de pandemia

Explorando el auge de los modelos de IA de código abierto en China

Resumen sobre los efectos transformadores de los modelos de inteligencia artificial de código abierto en la tecnología global.

La democratización de la IA

Superando barreras

Los desafíos del aprendizaje por refuerzo

Avances recientes en IA de código abierto

¿Qué piensas?

Escrito por Staff

Intel y su interés por adquirir SambaNova Systems: un avance hacia la inteligencia artificial

Intel planea adquirir SambaNova Systems, la startup innovadora de chips de inteligencia artificial

Sugerencias y Estrategias para Ganar en el Juego de Conexiones de NYT

Nueva función de Google Maps para recordar dónde aparcaste en iOS

Australia establece la primera prohibición mundial de redes sociales para menores de 16 años

Intel busca adquirir SambaNova Systems: un paso estratégico hacia la inteligencia artificial

Intel y su interés por adquirir SambaNova Systems: un avance hacia la inteligencia artificial

Intel planea adquirir SambaNova Systems, la startup innovadora de chips de inteligencia artificial

Sugerencias y Estrategias para Ganar en el Juego de Conexiones de NYT

Nueva función de Google Maps para recordar dónde aparcaste en iOS

Australia establece la primera prohibición mundial de redes sociales para menores de 16 años

Intel busca adquirir SambaNova Systems: un paso estratégico hacia la inteligencia artificial

La tecnología 5G avanzada de Huawei y sus proyecciones futuras

Revolucionando la producción de amoníaco para combatir los gases de efecto invernadero

Intel y su interés por adquirir SambaNova Systems: un avance hacia la inteligencia artificial

Intel planea adquirir SambaNova Systems, la startup innovadora de chips de inteligencia artificial

Sugerencias y Estrategias para Ganar en el Juego de Conexiones de NYT

La democratización de la IA

Superando barreras

Los desafíos del aprendizaje por refuerzo

Avances recientes en IA de código abierto

¿Qué piensas?

Log In

Sign In

Forgot password?

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections