En tan solo dos años, xAI de Elon Musk se ha convertido en uno de los doce laboratorios capaces de desarrollar modelos de IA de última generación. Ahora xAI ha lanzado su modelo de lenguaje Grok 3, que supera a los modelos de vanguardia, como GPT-4o de OpenAI y V3 de DeepSeek, en pruebas de referencia comunes de matemáticas, ciencias y codificación por un amplio margen. Mientras tanto, el Grok 3-mini, más pequeño, tiene un rendimiento a la par con los modelos de la competencia de mayor tamaño.

Según se informa, el nuevo modelo Grok se entrenó utilizando una potencia informática sin precedentes, primero con un grupo de 100.000 GPU Nvidia H100. Un pequeño grupo de desarrolladores rivales ha estado probando una versión preliminar de Grok 3, y la mayoría dice estar impresionada, con algunas salvedades. El cofundador de OpenAI, Andrej Karpathy, publicó en X que Grok 3 exhibió habilidades de razonamiento agudo y fue capaz de resolver algunos problemas complejos. Estima que el modelo está a la par con el modelo de razonamiento o1-Pro de OpenAI y es ligeramente mejor que DeepSeek-R1 y Gemini 2.0 Flash Thinking de Google.

Sin embargo, descubrió que Grok 3 se atragantaba con algunas indicaciones que se sabe que causan problemas a los modelos de transformadores grandes, como determinar cuántas L hay en «Lollapalooza», por ejemplo. El director ejecutivo de Scale AI, Alexandr Wang, publicó en X que Grok 3 es un modelo de última generación y lo felicita por lograr el primer puesto en el punto de referencia Chatbot Arena. Mientras que el escéptico de IA Gary Marcus, que también publicó en X, dijo que si bien Grok 3 muestra un progreso real, no representa un salto significativo más allá de los modelos existentes.

En los próximos días y semanas se publicarán más resultados de pruebas comparativas que ofrecerán una imagen más completa de cómo Grok 3 se compara con la competencia. Por impresionante que sea, el desarrollo de nuevos modelos «pensantes» avanza tan rápido que Grok 3 podría desaparecer de nuevo entre los modelos de referencia en tres meses. Los laboratorios de IA recién ahora están aprendiendo cómo aumentar la potencia de procesamiento que utilizan los modelos «pensantes» después de que se les presente un problema. Los próximos modelos de OpenAI, Anthropic, Google, DeepSeek y otros mostrarán los frutos de esa investigación.

Fuente: Fast Company | Mark Sullivan

Para leer más ingresa a: https://www.fastcompany.com/91281423/grok-3-model-puts-xai-at-the-top-tier-of-frontier-model-developers?utm_source=flipboard&utm_content=user/FastCompany

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *