Dolphin Gemma, the Google AI that helps decode dolphin communication/Dolphin Gemma, la IA de Google que ayuda a decodificar la comunicación de los delfines

in #science26 days ago

image.png
Source

Artificial intelligence never ceases to amaze us with its revolutionary uses: vast language models practically indistinguishable from those of humans, image and video generators that increasingly frighten aspiring Spielbergians, and now a tool that, hopefully, will allow us to communicate with other animal species. I'm talking about Dolphin Gemma, the new artificial intelligence model created by Google.

La inteligencia artificial no deja de sorprendernos con su revolucionarios usos, grandes modelos de lenguaje prácticamente indistinguibles de un ser humano, generadores de imágenes y vídeo que cada vez amedrentan más a los Spielberg y ahora una herramienta que, con suerte, nos permitirá comunicarnos con otras especies animales. Estoy hablando de Dolphin Gemma, el nuevo modelo de inteligencia artificial creado por Google.

Dolphin Gemma is an artificial intelligence model developed by Google in collaboration with the Georgia Institute of Technology and the Wild Dolphin Project (WDP). The project aims to decipher and understand the complex communication of dolphins, focusing specifically on the Stenella frontalis (Atlantic spotted dolphin), which lives in the Bahamas.

Dolphin Gemma es un modelo de inteligencia artificial desarrollado por Google, en colaboración con el Instituto Tecnológico de Georgia y el Wild Dolphin Project (WDP), con el que pretenden descifrar y entender la compleja comunicación de los delfines, centrándose en particular en la especie Stenella frontalis (delfín manchado del Atlántico) que habita en las Bahamas.


Source

This new AI model is based on Google's Gemma family of models, which in turn share technology with Gemini models, but is specifically tailored for analyzing sequential audio of dolphin vocalizations, such as whistles, clicks, and pulses, and efficiently representing them using the SoundStream tokenizer. The model has been trained on decades of underwater audio and video recordings collected by the WDP, where each sound is associated with behaviors, social contexts, and the identity of the dolphins involved.

Este nuevo modelo de IA se basa en la familia de modelos Gemma de Google, que a su vez comparten tecnología con los modelos Gemini, pero está adaptado específicamente para el análisis de audio secuencial de las vocalizaciones de delfines, como silbidos, clics y pulsos y la representación eficiente de mediante el tokenizador SoundStream. El modelo ha sido entrenado con décadas de grabaciones de audio y video submarino recopiladas por el WDP, donde cada sonido está asociado a comportamientos, contextos sociales y la identidad de los delfines involucrados.

DolphinGemma can identify, predict, and even imitate dolphin sounds—such as their signature whistles that function as names, echolocation clicks, and burst pulses—allowing it to detect patterns and potential rules in their communication. It receives sequences of natural dolphin sounds, identifies patterns, and predicts the sounds that are likely to follow, similar to how language models predict words in a human sentence.

DolphinGemma puede identificar, predecir e incluso imitar los sonidos de los delfines, como sus silbidos característicos que funcionan como nombres, clics de ecolocalización y pulsos de ráfaga, permitiendo detectar patrones y posibles reglas en su comunicación. Recibe secuencias de sonidos naturales de delfines, identifica patrones y predice los sonidos que probablemente seguirán, de manera similar a cómo los modelos de lenguaje predicen palabras en una oración humana.


Source

The ultimate goal would be to establish a form of interactive communication between humans and dolphins. To this end, the team is experimenting with systems such as CHAT, a portable device that generates artificial dolphin sounds in real time and allows testing whether dolphins can learn or recognize new "words" associated with objects or actions. The model is lightweight enough to run directly on mobile devices, facilitating its use in field research without the need for specialized hardware.

El objetivo final sería establecer una forma de comunicación interactiva entre humanos y delfines. Para ello, el equipo está experimentando con sistemas como CHAT, un dispositivo portátil que genera sonidos artificiales de delfín en tiempo real y permite probar si los delfines pueden aprender o reconocer nuevas “palabras” asociadas a objetos o acciones. El modelo es lo suficientemente ligero como para ejecutarse directamente en dispositivos móviles, facilitando su uso en investigaciones de campo sin necesidad de hardware especializado.

DolphinGemma represents a pioneering advance in our understanding of dolphin intelligence and social life, opening the door to new ways of protecting and managing these animals through more direct and understandable communication. Even better, who knows, with time and the improvement of these types of artificial intelligence applications, we may be able to communicate with all kinds of animals.

DolphinGemma representa un avance pionero en la comprensión de la inteligencia y la vida social de los delfines, y abre la puerta a nuevas formas de proteger y gestionar a estos animales mediante una comunicación más directa y comprensible. Y lo que es aún mejor, quien sabe si, con el tiempo y la mejora de este tipo de aplicaciones de inteligencia artificial, podremos llegar a comunicarnos con todo tipo de animales.

More information/Más información
https://blog.google/technology/ai/dolphingemma/

https://es.gizmodo.com/la-nueva-ia-de-google-esta-intentando-hablar-con-los-delfines-en-serio-2000160445