In partnership with

Bienvenidos, entusiastas de la IA.

Desde abril, todo el mundo estaba esperando a Mythos. El modelo capaz de encontrar vulnerabilidades de hace 27 años. El que supera a los mejores expertos humanos en ciberseguridad.

El que Anthropic mantenía bajo llave, accesible únicamente para unas cincuenta organizaciones cuidadosamente seleccionadas. El 9 de junio, Anthropic abrió la puerta. Claude Fable 5 es la versión de clase Mythos adaptada para el público general: estado del arte en prácticamente todos los benchmarks, con un rendimiento excepcional en ingeniería de software, investigación científica, visión artificial y trabajo del conocimiento.

Cuanto más larga y compleja es la tarea, mayor es su ventaja. Esto no es una actualización. No es una mejora incremental. Es el comienzo de una nueva era.

Y empieza hoy. Vamos a analizarlo...

Hoy en ReinoIA:

  • Anthropic acaba de lanzar Claude Fable 5 y Claude Mythos 5

  • Crea agentes de IA más fiables con testing automático

  • Apple paga 1.000 millones de dólares al año a Google para arreglar Siri. Y es una confesión histórica

  • 5 nuevas herramientas de IA

🚀 Anthropic acaba de lanzar Claude Fable 5 y Claude Mythos 5

Fuente: Anthropic

Resumen: El 9 de junio, Anthropic lanzó Claude Fable 5, un modelo de clase Mythos adaptado para un uso general seguro, disponible desde hoy para todos los suscriptores Pro, Max, Team y Enterprise.

Es el modelo que todo el mundo esperaba desde el anuncio de Project Glasswing en abril: sus capacidades superan las de cualquier modelo que haya estado disponible para el público general, alcanzando el estado del arte en casi todos los benchmarks, con un rendimiento excepcional en ingeniería de software, trabajo del conocimiento, visión artificial e investigación científica.

Cuanto más larga y compleja es la tarea, mayor es la ventaja de Fable 5 frente a otros modelos.

Al mismo tiempo, Anthropic lanzó Claude Mythos 5 para un grupo restringido de expertos en ciberdefensa y socios de infraestructura: el mismo modelo que Fable 5, pero sin las restricciones de seguridad relacionadas con la ciberseguridad.

Detalles:

  • Ingeniería de software: meses comprimidos en días. Stripe informó que Fable 5 completó en un solo día una migración a escala de una base de código de 50 millones de líneas de Ruby, una tarea que habría requerido más de dos meses de trabajo para un equipo completo.

  • Visión pura. Los modelos anteriores de Claude necesitaban herramientas adicionales para jugar a Pokémon FireRed. Fable 5 completó el juego entero utilizando únicamente capturas de pantalla sin procesar, sin ayudas, mapas ni herramientas externas.

  • Investigación científica autónoma. Mythos 5 llevó a cabo investigaciones en genómica de forma prácticamente autónoma durante más de una semana, ensamblando datos single-cell de millones de células pertenecientes a 138 especies animales y entrenando un modelo de machine learning que superó a un modelo publicado en la revista Science, siendo además 100 veces más pequeño.

  • Hipótesis científicas inéditas. Mythos 5 es el primer modelo de Anthropic capaz de generar de forma consistente hipótesis científicas nuevas y convincentes. En pruebas ciegas frente a modelos Opus, los científicos prefirieron las hipótesis de Mythos aproximadamente el 80 % de las veces.

  • El seguro en el gatillo. Clasificadores independientes detectan solicitudes relacionadas con ciberseguridad, biología, química o destilación de modelos y redirigen automáticamente al usuario hacia Claude Opus 4.8. Menos del 5 % de las sesiones activan este mecanismo. Más de 1.000 horas de red teaming externo no lograron producir ningún jailbreak universal.

  • Precio: 10 $ / 50 $ por millón de tokens, menos de la mitad del coste de Claude Mythos Preview. A partir del 23 de junio, los usuarios con planes de tarifa fija deberán utilizar créditos de uso para acceder a Fable 5.

Por qué es importante: Liberar un modelo tan potente implicaba riesgos reales. Por eso Anthropic tomó una decisión deliberada: lanzar primero los mecanismos de protección, aunque eso signifique bloquear ocasionalmente solicitudes inocentes, en lugar de esperar a que los sistemas de seguridad sean perfectos.

Es una muestra de transparencia poco habitual en la industria. Este lanzamiento marca un cambio de categoría. Fable 5 no es simplemente un modelo mejor. Es un modelo diferente.

Un modelo capaz de realizar investigación científica autónoma, migrar bases de código de 50 millones de líneas en 24 horas y formular hipótesis que los científicos prefieren frente a las de otros investigadores humanos.

La pregunta ya no es "¿puede la IA ayudarme?" Ahora la pregunta es:

"¿Qué sigue siendo irremplazable cuando una IA puede hacer investigación científica de forma autónoma durante una semana entera?"

Help us make better ads

Did you recently see an ad for beehiiv in a newsletter? We’re running a short brand lift survey to understand what’s actually breaking through (and what’s not).

It takes about 20 seconds, the questions are super easy, and your feedback directly helps us improve how we show up in the newsletters you read and love.

If you’ve got a few moments, we’d really appreciate your insight.

⚙️ Crea agentes de IA más fiables con testing automático

Resumen: Crear un agente de IA potente no es el verdadero desafío. El problema aparece cuando tienes que probarlo, depurarlo y mejorarlo sin romper lo que ya funciona. Ahí es donde entra Opik. La plataforma te permite observar el comportamiento de tus agentes, convertir errores reales en tests automáticos y corregir problemas de forma mucho más rápida. El resultado es un workflow completo para construir agentes más fiables y escalables.

Paso a paso:

  1. Conecta tu agente a Opik para monitorizar su comportamiento en producción.

  2. Identifica un fallo o una respuesta incorrecta que haya generado el agente.

  3. Convierte ese caso real en un Test Suite para evitar que el mismo error vuelva a aparecer.

  4. Ejecuta la suite de pruebas y verifica si el agente supera todos los escenarios.

  5. Utiliza Ollie, el agente integrado de Opik, para analizar trazas, detectar la causa del problema y proponer una corrección.

  6. Aplica el fix sugerido y vuelve a ejecutar la Test Suite.

  7. Despliega la nueva versión únicamente cuando todas las pruebas hayan sido superadas.

Consejo profesional: No construyas grandes datasets de pruebas desde el primer día. Empieza recopilando errores reales que encuentres durante el uso de tu agente. Cada fallo se convierte en un nuevo test. Con el tiempo crearás una suite de validación extremadamente valiosa que hará que cada nueva versión de tu agente sea más robusta que la anterior. Ese enfoque incremental suele ser mucho más eficaz que intentar anticipar todos los escenarios desde el inicio.

🍎 Apple paga 1.000 millones de dólares al año a Google para arreglar Siri. Y es una confesión histórica

Fuente: Gemini / Reino IA

El Resumen: En la WWDC 2026, Apple oficializó el secreto mejor guardado de la industria: Siri ahora funciona con un modelo Gemini personalizado de 1,2 billones de parámetros, licenciado por Google por aproximadamente 1.000 millones de dólares al año.Este modelo es aproximadamente ocho veces más grande que el mayor modelo en la nube que Apple había construido internamente hasta ahora, y pone fin a años de especulación sobre la estrategia de IA de la empresa más valiosa del mundo. La decisión es sorprendentemente sincera para Apple: en lugar de lanzar un producto inferior desarrollado internamente, la compañía decidió pagar a un competidor para mantenerse competitiva.

Detalles:

  • Arquitectura Mixture-of-Experts: el modelo solo activa un subconjunto relevante de sus 1,2 billones de parámetros para cada consulta. Esto le permite mantener el conocimiento de un modelo de escala billonaria mientras conserva una latencia competitiva para los miles de millones de consultas diarias de Siri.

  • Siri se convierte en una aplicación independiente, con una interfaz similar a iMessage, historial de conversaciones sincronizado mediante iCloud, posibilidad de adjuntar imágenes y documentos, y un modo chatbot avanzado accesible deslizando hacia abajo. Todo ello impulsado por infraestructura Nvidia Blackwell B200 en centros de datos.

  • Tres promesas finalmente cumplidas:

    • Comprensión del contexto personal (acceso a correos electrónicos, fotos y archivos).

    • Comprensión de lo que aparece en pantalla.

    • Ejecución de acciones complejas entre múltiples aplicaciones.

    Estas funciones fueron anunciadas en la WWDC 2024 y nunca llegaron a lanzarse durante dos años.

  • Apple también pagó 250 millones de dólares en mayo de 2026 para resolver una demanda colectiva de usuarios de iPhone que acusaban a la empresa de publicidad engañosa relacionada con estas capacidades de IA. Siri Gemini es, literalmente, el producto que ese acuerdo estaba esperando.

  • Apple evaluó modelos de Google, OpenAI y Anthropic antes de seleccionar Gemini. El modelo resultante, denominado internamente AFM Cloud Pro, es una construcción completamente personalizada para las necesidades específicas de Apple.

  • Gene Munster, de Deepwater Asset Management, estima que el valor total del acuerdo plurianual podría alcanzar hasta 5.000 millones de dólares.

Por qué es importante: Apple construyó su reputación sobre la integración vertical: hardware, software y servicios desarrollados internamente.

Este acuerdo representa la primera grieta visible en ese modelo fundacional. La compañía más cercana a una valoración de 4,5 billones de dólares ha preferido pagar a un rival antes que lanzar un producto mediocre. Es al mismo tiempo una confesión y una poderosa señal para toda la industria: ni siquiera Apple puede permitirse desarrollar la IA por sí sola.

La carrera por los modelos frontier se ha vuelto tan rápida, tan costosa y tan decisiva que incluso las mayores empresas del mundo prefieren pagar a sus competidores antes que quedarse atrás.

Y si Apple ha tenido que rendirse, ¿quién puede seguir afirmando que la IA se construye realmente en solitario?

Herramientas de IA

🛠 Nuestras recomendaciones de herramientas de IA

🛍️ Alexa para compras - Agente de compras para preguntas y respuestas, seguimiento de precios y compras automáticas

💻 Higgsfield Supercomputer - Agente de IA en la nube con herramientas, memoria y mucho más

🔐 Incognito Chat - Nueva forma de tener conversaciones privadas con Meta AI en WhatsApp

🎨 Recraft V4.1 - IA de imágenes con mejoras en fotorrealismo, ilustración y mucho más

⚙️ Notion Developer Platform - Plataforma abierta para desarrollar aplicaciones directamente sobre Notion.

Gracias por leer...

Que te pareció la newsletter de hoy?

Antes de que te vayas, nos encantaría saber qué opinas sobre la newsletter de hoy para ayudarnos a mejorar el contenido.

Login or Subscribe to participate

Espero que esto haya sido útil...

Si deseas aprender más, visita este sitio web.

Síguenos en LinkedIn para aprender más en profundidad sobre la IA.

Reply

Avatar

or to participate

Keep Reading