- Reino IA
- Posts
- 🐬Google aprende a hablar con delfines. Una nueva era de comunicación entre especies.
🐬Google aprende a hablar con delfines. Una nueva era de comunicación entre especies.
BONUS: Haz hablar a tu perro con esta herramienta IA

Bienvenidos, entusiastas de la IA.
Google ha desarrollado DolphinGemma, un modelo de IA diseñado para analizar y generar vocalizaciones de delfines. Esto podría acercarnos a entender cómo se comunican estos inteligentes mamíferos marinos, aunque aún hay complejidades por resolver. Vamos a analizarlo...
Hoy en ReinoIA:
Google aprende a hablar con delfínes. Una nueva era de comunicación entre especies.
Haz hablar a tu perro con esta herramienta IA
China lanza el primer hospital del mundo dirigido por IA
5 nuevas herramientas de IA
🐬Google aprende a hablar con delfines. Una nueva era de comunicación entre especies.

Fuente: Bitácora de un buscador.
Resumen: DolphinGemma es un modelo de IA entrenado con 40 años de datos de sonidos de delfines. Su objetivo es identificar patrones en sus clics, silbidos y pulsos, y generar sonidos similares, lo que podría facilitar la comunicación interspecies en el futuro.
Detalles:
Este proyecto se enfoca en descifrar la comunicación de los delfines, particularmente los delfines manchados del Atlántico (Stenella frontalis), estudiados por WDP desde 1985 en las Bahamas. El modelo, basado en la serie Gemma de Google, está diseñado para procesar y generar vocalizaciones de delfines, utilizando técnicas de modelos de lenguaje grandes adaptadas para audio.
El modelo, con aproximadamente 400 millones de parámetros, emplea un tokenizador SoundStream y puede ejecutarse en dispositivos móviles como los teléfonos Google Pixel, lo que lo hace ideal para investigaciones de campo. Está entrenado con una vasta base de datos acústica recopilada por WDP, que incluye clics, silbidos y pulsos de ráfaga, sonidos que los delfines usan para diversas interacciones sociales, como reuniones (silbidos de firma), peleas (squawks de pulsos de ráfaga) y cortejo o persecución de tiburones (zumbidos de clics).
DolphinGemma funciona de manera similar a los modelos de lenguaje grandes para humanos, pero para audio: recibe entradas de audio, identifica patrones y predice sonidos subsiguientes, generando secuencias que imitan las vocalizaciones de los delfines. Esto se integra con el sistema CHAT (Cetacean Hearing Augmentation Telemetry), un ordenador subacuático desarrollado para facilitar la comunicación bidireccional. CHAT usa silbidos artificiales fuera del repertorio natural de los delfines para etiquetar objetos de juego, como sargazo, bufandas o cuerdas, y traduce estos silbidos en palabras en inglés para los buceadores, con voces masculinas para salidas y femeninas para entradas. Un evento notable ocurrió en agosto, cuando un delfín imitó un silbido que desencadenó la palabra "sargazo" en el oído de un buceador, aunque no necesariamente con comprensión contextual.
Por qué es importante:
Comprensión Científica: Descifrar la comunicación de los delfines podría revelar detalles sobre sus estructuras sociales, comportamientos y capacidades cognitivas. Por ejemplo, entender cómo coordinan actividades de caza, mantienen relaciones o resuelven problemas podría profundizar nuestra apreciación de su inteligencia.
Conservación: Una mejor comprensión de sus vocalizaciones, especialmente señales de distress, podría ayudar a monitorear la salud y el bienestar de las poblaciones de delfines, permitiendo intervenciones oportunas frente a amenazas como la contaminación o la pesca incidental.
Comunicación Interespecies: La posibilidad de interactuar con delfines abre nuevas fronteras en la investigación de la cognición animal, desafiando nuestra comprensión de la inteligencia y la conciencia a través de especies. Esto podría fomentar interacciones más empáticas y informadas con el mundo natural.
Aplicaciones de IA: Este proyecto demuestra la versatilidad de los modelos de lenguaje grandes más allá del procesamiento del lenguaje humano, mostrando su potencial en bioacústica y posiblemente en otros campos como el procesamiento de señales.
🐶Haz hablar a tu perro con esta herramienta IA
Resumen: Heygen ha lanzado su nueva función de voz con Avatares IA (Avatar IV). Puedes poner a hablar literalmente todo lo que se te ocurra.
En calidad de generación de contenido con avatares IA, probablemente sea la mejor opción disponible actualmente.
Paso a paso:
Regístrate en Heygen y crea una cuenta
Click en “Image to Video with Avatar IV” y “Crear Video”
Sube una imagen
Añade un guion y elige la voz (Disponible en múltiples idiomas), o graba tu propia voz y clónala.
Observa los resultados
Consejo profesional: Enfócate en cuatro aspectos clave para lograr un resultado profesional y atractivo:
Naturalidad en la voz: Ajusta el tono, la entonación y el ritmo para que el avatar suene lo más humano posible. Dedica tiempo a personalizar estos elementos en HeyGen, ya que una voz convincente es esencial para captar la atención de tu audiencia.
Selección del avatar: Escoge un avatar que se adapte al contexto del mensaje y al público objetivo. HeyGen ofrece diversas opciones, así que elige uno cuyo estilo y apariencia refuercen el propósito de tu video, evitando distracciones o desconexiones con los espectadores.
Calidad del audio: Asegúrate de que el sonido sea claro y libre de interferencias. Graba en un entorno silencioso y, si es necesario, edita el audio para eliminar ruidos. La calidad del sonido es tan importante como el contenido del mensaje.
Revisión final: Antes de publicar, previsualiza el video en HeyGen y ajusta cualquier detalle, como el guion o las expresiones del avatar, para garantizar que todo fluya de manera natural y efectiva.
🏥China lanza el primer hospital del mundo dirigido por IA

Fuente: Q´pasa
El Resumen: China ha marcado un hito en la medicina con la apertura del Smart Medical Center en Shenzhen, el primer hospital del mundo operado íntegramente por robots médicos impulsados por inteligencia artificial (IA). Este centro cuenta con 14 robots especializados en cirugía, diagnóstico, enfermería y logística, capaces de atender consultas en minutos con una precisión del 98%
Detalles:
Ubicación y estructura: Situado en Shenzhen, el Smart Medical Center opera con:
5 robots cirujanos: Realizan intervenciones complejas con una precisión de 0.01 mm.
3 asistentes diagnósticos: Entrenados con millones de casos clínicos, alcanzan un 98% de exactitud.
4 robots enfermeros: Gestionan medicación, monitoreo de signos vitales y cuidados rutinarios.
2 robots logísticos: Transportan muestras biológicas y equipos, mejorando la eficiencia interna.
Los pacientes interactúan a través de una interfaz digital, donde introducen síntomas. Sensores recogen más de 200 parámetros fisiológicos, y el sistema cruza datos con una base de 25 millones de casos clínicos, generando diagnósticos y planes terapéuticos en segundos.
Por qué es importante:
Eficiencia y accesibilidad: La automatización reduce tiempos de espera y permite atender a más pacientes, especialmente en áreas con escasez de médicos, como zonas rurales o de desastre.
Innovación tecnológica: Posiciona a China como líder en la integración de IA en la salud, impulsando avances en cirugía, diagnóstico y gestión hospitalaria.
Impacto global: El modelo podría replicarse en otros países, transformando la atención médica, aunque plantea dilemas éticos sobre la humanización y la confianza en sistemas autónomos.
Desafíos éticos: La falta de interacción emocional y la responsabilidad ante errores de IA son preocupaciones clave que requerirán regulaciones estrictas.
Este avance no busca reemplazar a los médicos humanos, sino potenciar sus capacidades, abriendo un debate sobre el futuro de la medicina en un mundo cada vez más automatizado.
Herramientas de IA
🛠 Nuestras recomendaciones de herramientas de IA
👀Be my eyes - Más de medio millón de personas ciegas o con baja visión en todo el mundo lo utilizan para descripciones visuales.(enlace)
🎭 Starry IA - Una aplicación de generación de arte con inteligencia artificial que crea imágenes a partir de textos.(enlace)
🎆 Fireflies IA - Un asistente de voz con inteligencia artificial que ayuda a transcribir, tomar notas y analizar reuniones en Zoom, Google Meet, Webex y Microsoft Teams. (enlace)
🤖 PolyCam - Una aplicación de escaneo 3D que hace que sea muy fácil convertir objetos y lugares en modelos 3D usando solo nuestros teléfonos.(enlace)
📷 Remini - Convierte tus imágenes antiguas, pixeladas, borrosas o dañadas en fotos de alta definición con solo un toque (enlace)
Gracias por leer...
Que te pareció la newsletter de hoy?Antes de que te vayas, nos encantaría saber qué opinas sobre la newsletter de hoy para ayudarnos a mejorar el contenido. |
Iniciar Sesión o Suscríbete para participar en las encuestas. |
![]() | Espero que esto haya sido útil... Si deseas aprender más, visita este sitio web. Síguenos en 𝕏/Twitter para aprender más sobre IA: |
Reply