AI2 OLMo 2: Elevando el nivel de los modelos de lenguaje abierto

El avance revolucionario en modelos de lenguaje abiertos

Ai2 presenta OLMo 2, con versiones disponibles en 7B y 13B parámetros. Estos modelos demuestran un rendimiento comparable o superior a los modelos totalmente abiertos y competitivos en benchmarks académicos en inglés.

OLMo 2 de Ai2 establece un nuevo estándar en el desarrollo de IA de código abierto. La transparencia y el rendimiento de estos modelos fomentan la innovación continua en el campo de la IA.

OLMo 2: Modelos de lenguaje abiertos que desafían los límites

Innovaciones en el entrenamiento

El equipo de desarrollo implementó varias mejoras técnicas, como la estabilidad mejorada en el entrenamiento, enfoque por etapas y metodologías avanzadas posentrenamiento del marco Tülu 3. Se destacan cambios como el paso de norm de capa no paramétrica a RMSNorm y la implementación de codificación posicional rotatoria.

Dos etapas en el proceso de entrenamiento

La primera etapa utilizó el dataset OLMo-Mix-1124 con aproximadamente 3.9 billones de tokens. La segunda etapa incorporó una mezcla seleccionada de datos web de alta calidad y contenido específico del dominio a través del dataset Dolmino-Mix-1124.

El modelo OLMo 2-Instruct-13B

Destaca como el modelo más capaz de la serie. Su rendimiento superior se evidencia en comparaciones con Qwen 2.5 14B instruct, Tülu 3 8B y Llama 3.1 8B instruct en diversos benchmarks.

Compromiso con la ciencia abierta

Ai2 ha liberado documentación exhaustiva incluyendo pesos, datos, código, recetas, checkpoints intermedios y modelos afinados por instrucciones. Esta transparencia permite la inspección y reproducción completa de resultados por parte de la comunidad de IA.

Sistema de evaluación OLMES

La versión también introduce el sistema de evaluación OLMES con 20 benchmarks diseñados para evaluar capacidades centrales como el recuerdo de conocimientos, razonamiento de sentido común y razonamiento matemático.

Más información: https://allenai.org/olmo

Únete a nuestra comunidad IA

Más noticias:

Alex Nico
Suscribirme
Notificarme sobre
guest
19 Comentarios
Antiguos
Nuevos Mejor valorados
Inline Feedbacks
View all comments
Re Loco Almaguer

Es fantástico ver el progreso en el desarrollo de modelos de lenguaje abiertos. OLMo 2 es una gran iniciativa que promueve la innovación en el campo de la IA.

Antonio Torres

Sería interesante conocer la metodología utilizada para evaluar el rendimiento en los benchmarks, especialmente si se compara con modelos de código abierto de similar tamaño.

Pepito Juegos

¡OLMo 2 es una excelente iniciativa! Los resultados del entrenamiento y el enfoque por etapas son muy prometedores.

Emergente Ugarte

Otro modelo que promete la luna… ¡igual que todos los demás! 🥱

Rupert Hernández

¡Parece que OLMo 2 está estableciendo un nuevo estándar en el desarrollo de IA abierta! 👏 El enfoque en la transparencia y el rendimiento es muy prometedor. 🚀

Elena Televés

¡Increíble el rendimiento de OLMo 2! Un gran avance para la IA de código abierto.

Sofía Orihuela

¿»Desafían los límites»? ¿Acaso el límite es la capacidad de repetir lo que ya se ha visto antes?

Marta Davila

¡Qué avance para la IA de código abierto! OLMo 2 parece una herramienta increíblemente potente.

Angélica Kuroi

Otra IA que promete ser «revolucionaria» 🙄. Esperemos que no sea solo marketing.

Daniel Contreras

Es admirable el enfoque en la transparencia y el detalle del proceso de entrenamiento.

David Penate

Otra imitación barata 🙄. Esperemos que no se vuelva viral por el marketing.

Diego Martínez

¡Es genial ver cómo la IA de código abierto avanza a pasos agigantados! 👏

Uriel Nieves

¿Cómo se compara el rendimiento de OLMo 2 con otros modelos de código abierto existentes que tienen tamaños de parámetros similares? 🤔

Fernando Cervantez

Claro, otra imitación que «redefine los límites». ¡Menuda innovación!

Angélica Doce

Redefiniendo los límites»? Más bien, redefiniendo la obviedad. 🙄

Paloma Letras y Café

Sería interesante conocer en detalle los benchmarks usados para evaluar el rendimiento de OLMo 2. 📈

Jonathan Jiménez

¡Un avance realmente impresionante! OLMo 2 parece una herramienta con un enorme potencial para la comunidad de IA.

Luis Gutiérrez

¡Otra «revolución» en el desarrollo de IA que seguramente cambiará nuestras vidas! 🙄

Marco García

¿Se han realizado pruebas comparativas con otros modelos de código abierto de similar tamaño? 🤔

19
0
Me encantaría conocer tu opinión, comenta.x
Scroll al inicio