ニュースの概要
Googleが、イルカのコミュニケーション方法を解読し、将来的には種間コミュニケーションを可能にするためのAIモデル「DolphinGemma」を開発しました。このモデルはイルカの音の構造を学習し、新しいイルカのような音声シーケンスを生成することもできます。約4億のパラメータを持つDolphinGemmaは、Google Pixelスマートフォン上でも効率的に動作するよう最適化されており、今夏にオープンモデルとしてリリースされる予定です。
✅ リリース企業名
Google LLC
ニュース内容
Googleは、ジョージア工科大学のエンジニアと協力し、Wild Dolphin Project(WDP)の現地調査を活用して、イルカのコミュニケーションを解読するAIモデル「DolphinGemma」を開発しました。
1985年から活動しているWDPは、イルカの文脈特異的な音(個体識別のための「ホイッスル」、衝突や攻撃的な遭遇に関連する「スクォーク」、求愛活動やサメを追いかける際に検出される「クリックバズ」など)に関する深い理解を持っています。WDPの目標は、これらの自然な音のシーケンス内の固有の構造と潜在的な意味を明らかにし、言語の形を示す可能性のある文法的ルールとパターンを探ることです。
DolphinGemmaは、SoundStreamトークナイザーを使用してイルカの音を効率的に表現し、複雑なシーケンスを処理するのに適したモデルアーキテクチャにこのデータを供給します。GoogleのGemmaファミリーをベースにしたこのモデルは、オーディオ入力・出力システムとして機能し、WDPの広範なデータベースからのイルカの自然な音のシーケンスを学習して、繰り返しパターンと構造を特定します。
また、CHAT(Cetacean Hearing Augmentation Telemetry)システムを通じて双方向のインタラクションも探求しており、Google Pixelスマートフォンが高品質のオーディオデータをリアルタイムで処理するための重要な役割を果たしています。
GoogleはDolphinGemmaを今夏にオープンモデルとしてリリースする予定で、他の海洋哺乳類研究者も利用できるようにする計画です。
出典
🔗 AI News – DolphinGemma: Google AI model understands dolphin chatter
🔗 https://www.artificialintelligence-news.com/news/dolphingemma-google-ai-model-understands-dolphin-chatter/
AIVISOR編集部より
GoogleのDolphinGemmaは、AIの応用範囲を人間の言語を超えて拡大する画期的な取り組みです。この研究は単にイルカとのコミュニケーションに留まらず、AIが異種間の言語障壁を橋渡しする可能性を示しています。
企業にとっては、AIの言語理解能力が人間の言語だけでなく、より広範な音声パターンや信号に適用できることを示す重要な事例です。この技術は将来的に、音声認識、異常検知、環境モニタリングなど様々な分野での応用が考えられます。特に非言語的なコミュニケーションや複雑な音響パターンの解析が必要な産業において、新たなAI活用の可能性を開くでしょう。