• Reino IA
  • Posts
  • IA construye mundos de juegos al instante

IA construye mundos de juegos al instante

Un juego de mundo abierto creado por IA, vuestros PDFs ya no tienen secretos y los robots se vuelven cada vez más autónomos.

Bienvenidos, entusiastas de la IA.

La línea entre la imaginación y el juego se ha vuelto mucho más delgada, gracias a un arquitecto de IA que lleva los videojuegos a un nuevo territorio.

Un nuevo modelo llamado Oasis genera entornos de mundo abierto jugables en tiempo real, y el desarrollo de videojuegos tradicional puede que nunca sea igual. Vamos a entrar en detalles…

Hoy en ReinoIA:

  • El modelo de IA Oasis genera juegos de mundo abierto.

  • Claude obtiene nuevas capacidades de visión para PDFs.

  • Physical Intelligence consigue 400 millones de dólares para mejorar los robots.

🕹 El modelo de IA Oasis genera juegos de mundo abierto.

Resumen: Los laboratorios de IA Decart y Etched acaban de lanzar Oasis, un modelo de IA que genera entornos jugables de videojuegos en tiempo real, acompañado de una demostración jugable al estilo Minecraft.

Los detalles:

  • Oasis responde a entradas de teclado y ratón para generar entornos de juego fotograma a fotograma, incluyendo física, interacciones con objetos y iluminación dinámica.

  • Funcionando a 20 FPS en hardware actual, Oasis opera 100 veces más rápido que los modelos tradicionales de generación de video con IA.

  • Las empresas están lanzando el código, un modelo de 500 millones de parámetros para pruebas locales, y una demostración jugable de una versión más grande.

  • Las versiones futuras funcionarán en resolución 4K en el próximo chip Sohu de Etched, con la capacidad de escalar para manejar 10 veces más usuarios y modelos masivos de más de 100 mil millones de parámetros.

Por qué es importante: Mientras que la tecnología de texto a video ha acaparado los titulares, Oasis representa algo más profundo: mundos interactivos generados en tiempo real completamente por IA. Esto podría revolucionar la forma en que pensamos sobre el desarrollo de videojuegos y los entornos virtuales, incluso eliminando potencialmente la necesidad de motores de juego tradicionales.

👁 Claude obtiene nuevas capacidades de visión para PDFs.

Resumen: Anthropic acaba de lanzar el soporte para PDFs en la versión beta pública de su modelo Claude 3.5 Sonnet, lo que desbloquea la capacidad de analizar tanto textos como documentos visuales, como gráficos e imágenes dentro de documentos grandes.

Los detalles:

  • El sistema procesa los PDFs en tres etapas: extrae el texto, convierte las páginas en imágenes y realiza un análisis combinado visual-textual.

  • El modelo admite documentos de hasta 32 MB y 100 páginas, manejando todo, desde informes financieros hasta documentos legales.

  • La función también puede integrarse con otras características de Claude, como el almacenamiento en caché de solicitudes y el procesamiento por lotes.

  • Las capacidades visuales están disponibles tanto a través de la plataforma Claude de Anthropic como mediante acceso directo a la API en aplicaciones.

Por qué es importante: La capacidad de Claude para manejar documentos grandes ya era un cambio radical, pero ver y comprender las imágenes dentro de ellos lleva esta capacidad a un nivel completamente nuevo. Esta actualización transforma a Claude en un analista más completo para industrias como la salud o las finanzas, donde la información crítica a menudo es visual.

🤖 Physical Intelligence consigue 400 millones de dólares para mejorar los robots.

Resumen: La startup de IA Physical Intelligence acaba de asegurar 400 millones de dólares en financiación liderada por Jeff Bezos y OpenAI, valorando la empresa en 2.4 mil millones de dólares mientras presenta su modelo π0 (pi-cero) para el control de robots de propósito general.

Los detalles:

  • La ronda reúne a gigantes tecnológicos y firmas de capital riesgo, con Thrive Capital, Lux Capital, Khosla Ventures y Sequoia Capital uniéndose a Bezos y OpenAI.

  • El sistema π0 tiene como objetivo crear un modelo universal para entender comandos en lenguaje natural en cualquier plataforma robótica.

  • Las primeras demostraciones muestran robots realizando tareas complejas de múltiples etapas, como doblar ropa, empacar huevos, limpiar mesas, entre otras.

  • π0 se entrenó con más de 10,000 horas de datos de manipulación hábil y conjuntos de datos de código abierto, afirmando que es la mezcla de preentrenamiento más grande utilizada en el sector.

Por qué es importante: Aparece otro competidor en el sector de la robótica, y los robots universales de propósito general podrían desbloquear la automatización en industrias donde otros robots humanoides han sido demasiado inflexibles y especializados. Además, la inteligencia física seguramente atraerá la atención de la industria con el respaldo de OpenAI y Bezos.

Gracias por leer...

Espero que esto haya sido útil...

Si deseas aprender más, visita este sitio web.

Síguenos en 𝕏/Twitter para aprender más sobre IA:

Reply

or to participate.