DolphinGemma

fav gif
Kaydet
Alıntıla
kure star outline
IMG_5345.jpeg

DolphinGemma

Web Sitesi(leri)

https://blog.google/technology/ai/dolphingemma/

Yayınlanma Tarihi

2025-04-14

DolphinGemma, Google tarafından geliştirilen, deniz memelilerinin vokalizasyonlarını analiz etmek amacıyla tasarlanmış bir yapay zeka modelidir. Model, Google’ın Gemma adlı açık kaynaklı büyük dil modeli serisine dayanmaktadır ve özellikle Atlantik benekli yunusların (Stenella frontalis) sesli iletişimlerini incelemek üzere yapılandırılmıştır. Yaklaşık 400 milyon parametreye sahip olan DolphinGemma, ses girişlerini işleyip ses çıktıları üretebilen bir “audio-in/audio-out” model olup, ses dizileri arasındaki yapısal örüntüleri çözümlemeye yöneliktir.


Ortak Çalışma ve Veri Tabanı

Model, Wild Dolphin Project (WDP) ile iş birliği içinde geliştirilmiştir. 1985 yılından itibaren Bahamalar’da belirli bir Atlantik benekli yunus topluluğunu gözlemleyen WDP, bireysel yunuslara ait yaşam öyküleri, davranış gözlemleri ve etiketlenmiş sualtı ses-video kayıtları içeren kapsamlı bir veri seti üretmiştir. DolphinGemma, bu veri tabanı kullanılarak eğitilmiştir. Google’ın geliştirdiği SoundStream ses kodlayıcısı aracılığıyla yunus sesleri token’lara dönüştürülerek modelin öğrenme sürecine aktarılmıştır.

Modelin İşleyişi ve Araştırma Hedefleri

DolphinGemma, doğal yunus vokalizasyonları arasındaki ardışıklığı analiz ederek, ses dizilerinde tekrarlayan kalıpları ve yapıları tanımlamayı amaçlamaktadır. Model, insan dilinde kullanılan büyük dil modelleriyle benzer şekilde çalışır; önceki sesleri girdilerken, olasılıkla takip edecek sesleri tahmin eder. Bu yapı sayesinde araştırmacılar, doğal seslerin anlamlı örüntüler içerip içermediğini ve iletişimde bir tür dil yapısının olup olmadığını incelemektedir.


Soldaki Resim: Bir anne benekli yunus, yiyecek ararken yavrusunu gözlemliyor. İşini bitirdiğinde yavrusunu geri çağırmak için kendine özgü imza ıslığını kullanacaktır. Sağdaki Resim: Islığın görselleştirildiği bir spektrogram (Kaynak: Google)

CHAT Sistemi ile Entegrasyon

DolphinGemma’nın sahada uygulanacağı sistemlerden biri, Georgia Institute of Technology iş birliğiyle geliştirilen CHAT (Deniz Memelileri İşitsel Artırma ve Telemetri Sistemi, Cetacean Hearing Augmentation Telemetry) adlı sualtı iletişim sistemidir. Bu sistem, doğrudan yunusların karmaşık doğal iletişimlerini çözümlemek yerine, daha sade ve paylaşımlı bir kelime dağarcığı oluşturmayı amaçlamaktadır. CHAT, yapay olarak üretilmiş ve belirli nesnelerle ilişkilendirilmiş ıslık sesleri ile yunusların bu sesleri taklit ederek iletişim kurabileceği varsayımına dayanır.



CHAT sistemi, kullanıcıdan gelen taklit sesleri algılayarak; hangi sesin üretildiğini tanımlar, araştırmacıya bilgi verir ve araştırmacının ilgili nesneyi sunmasını sağlar. Bu döngü, ses–nesne ilişkisinin pekiştirilmesini mümkün kılar. İlk nesillerinde Google Pixel 6 kullanılan sistemin, 2025 yaz sezonunda Pixel 9 modeliyle çalışan yeni nesil versiyonu sahaya entegre edilecektir. Bu yeni sistemde, hem derin öğrenme modelleri hem de şablon eşleme algoritmaları aynı anda çalıştırılabilmektedir.

Teknik Özellikler ve Uygulama Alanları

DolphinGemma’nın yaklaşık 400 milyon parametreli yapısı, saha çalışmaları için taşınabilir cihazlarla uyumludur. Bu, hem özel donanım ihtiyacını azaltmakta hem de okyanus koşullarındaki uygulamalarda sistemin verimliliğini artırmaktadır. DolphinGemma, öncelikle Atlantik benekli yunuslara ait seslerle eğitilmiş olsa da, tırtak veya döner yunus gibi farklı türlerin vokalizasyonlarına uyarlanabilecek şekilde açık kaynaklı olarak paylaşılacaktır. Modelin esnek yapısı, araştırmacıların kendi veri kümeleriyle yeniden eğitme yapabilmesini mümkün kılmaktadır.

Bilimsel Katkılar ve Kullanım Potansiyeli

Model, deniz memelilerinin doğal sesli iletişimlerini çözümleme amacıyla bilimsel araştırmalarda kullanılmaktadır. Önceden yalnızca insan emeğiyle yürütülen ses analizi süreçlerinin otomatik hale getirilmesi, araştırma süresini kısaltmakta ve örüntülerin daha sistematik biçimde tespit edilmesini sağlamaktadır. Ayrıca, DolphinGemma’nın çıktıları, CHAT sistemiyle bütünleştirilerek daha etkileşimli bir araştırma ortamı sunmaktadır. Bu sayede doğal ses dizilerinden elde edilen örüntüler, basit etkileşim modellerine dönüştürülebilir.

Açık Erişim ve Gelecek Perspektifi

Google, DolphinGemma modelini 2025 yazında açık kaynaklı olarak araştırma topluluğuyla paylaşmayı planlamaktadır. Bu paylaşım, dünya çapında deniz memelisi araştırmaları yapan kurum ve akademisyenlerin modele erişimini kolaylaştıracak, farklı türlerin sesli iletişimlerine yönelik incelemelerde modelin kullanımını teşvik edecektir. Bu yaklaşımın, deniz memelileriyle ilgili sesli iletişim araştırmalarında uluslararası ölçekte ortak çalışmaları artırması beklenmektedir.

Kaynakça

Artificial Intelligence News. “DolphinGemma: Google AI Model Understands Dolphin Chatter.” Erişim 16 Nisan 2025. https://www.artificialintelligence-news.com/news/dolphingemma-google-ai-model-understands-dolphin-chatter/.

Ars Technica. “Google Created a New AI Model for Talking to Dolphins.” Erişim 16 Nisan 2025. https://arstechnica.com/science/2025/04/google-created-a-new-ai-model-for-talking-to-dolphins/.

NuvemMag. “Google Artık Pixel Telefonlarını Yunuslarla Konuşmak İçin Kullanıyor.” Erişim 16 Nisan 2025. https://www.nuvemmag.com/post/google-artik-pixel-telefonlarini-yunuslarla-konusmak-icin-kullaniyor.

TechCrunch. “Google’s Newest AI Model Is Designed to Help Study Dolphin Speech.” Erişim 16 Nisan 2025. https://techcrunch.com/2025/04/14/googles-newest-ai-model-is-designed-to-help-study-dolphin-speech/.

YouTube. “Google’ın Yunuslarla Konuşma Projesi – Tanıtım Videosu 1.” Erişim 16 Nisan 2025. https://m.youtube.com/watch?v=T8GdEVVvXyE.

YouTube. “Google AI Dolphin Interface – Demonstration 2.” Erişim 16 Nisan 2025. https://m.youtube.com/watch?v=YhopeQKbpZA.

Sen de Değerlendir!

0 Değerlendirme

Yazar Bilgileri

Avatar
YazarÖmer Said Aydın16 Nisan 2025 18:46

Etiketler

Tartışmalar

Henüz Tartışma Girilmemiştir

"DolphinGemma" maddesi için tartışma başlatın

Tartışmaları Görüntüle

İçindekiler

  • Ortak Çalışma ve Veri Tabanı

  • Modelin İşleyişi ve Araştırma Hedefleri

  • CHAT Sistemi ile Entegrasyon

  • Teknik Özellikler ve Uygulama Alanları

  • Bilimsel Katkılar ve Kullanım Potansiyeli

  • Açık Erişim ve Gelecek Perspektifi

Bu madde yapay zeka desteği ile üretilmiştir.

KÜRE'ye Sor