Bild: Vecteezy

Können wir bald mit unseren Haustieren sprechen? KI soll Hundebellen übersetzen

Forscher*innen der University of Michigan haben sich einer ungewöhnlichen Herausforderung gestellt: Sie untersuchen, ob Künstliche Intelligenz (KI) helfen kann, die Bedeutung von Hundebellen zu entschlüsseln. Ihr Ziel ist es, festzustellen, ob ein Bellen Verspieltheit oder Aggression ausdrückt.

Hierfür nutzen sie KI-Modelle, die ursprünglich für die Analyse menschlicher Sprache entwickelt wurden. Dadurch sollten die feinen Nuancen in den Lauten der Tiere erkennbar werden.

Herausforderungen bei der Entwicklung

Rada Mihalcea, Professorin für Informatik und Ingenieurwesen sowie Direktorin des KI-Labors der Universität Michigan, sagte: „Durch den Einsatz von Sprachverarbeitungsmodellen, die zunächst auf menschliche Sprache trainiert wurden, öffnen wir ein neues Fenster, wie wir das bisher Erreichte in der Sprachverarbeitung nutzen können, um die Nuancen von Hundebellen zu verstehen.“

Ein zentrales Hindernis bei der Entwicklung von KI-Modellen zur Analyse von Hundelauten sei das Fehlen öffentlich zugänglicher Daten. Artem Abzaliev, Hauptautor der Studie und Doktorand an der University of Michigan, erklärte, dass Tierlaute passiv in der Wildnis oder bei Haustieren mit Erlaubnis der Besitzer aufgenommen werden müssen.

Nutzung von Wav2Vec2-Modellen

Laut der Universität Michigan haben die Forscher*innen diese Herausforderungen überwunden: Sie verwendeten ein Datenset von Hundelauten – 74 Hunde verschiedener Rassen, Altersgruppen und Geschlechter wurden in unterschiedlichen Kontexten aufgenommen. Ein Team unter der Leitung von Humberto Pérez-Espinosa am INAOE (National Institute of Astrophysics, Optics and Electronics) habe diverse Aufnahmen gesammelt. Abzaliev modifizierte diese Aufnahmen, um ein maschinelles Lernmodell anzupassen, das Muster in großen Datensätzen erkennt. Sie wählten das Sprachrepräsentationsmodell Wav2Vec2, das ursprünglich auf menschliche Sprachdaten trainiert wurde.

Verbesserung der Kommunikation zwischen Mensch und Hund

Mit diesem Modell haben die Forscher*innen Darstellungen der akustischen Daten der Hunde erzeugt und interpretiert. Es zeigte sich, dass Wav2Vec2 nicht nur vier Klassifikationsaufgaben erfolgreich bewältigte, sondern auch andere speziell auf Hundebellen trainierte Modelle mit Genauigkeitswerten von bis zu 70 Prozent übertraf.

Mihalcea betonte:

„Unsere Ergebnisse zeigen, dass die aus menschlicher Sprache abgeleiteten Klänge und Muster als Grundlage für die Analyse und das Verständnis akustischer Muster anderer Geräusche dienen können, wie etwa Tierlaute.“

Das Verständnis der Nuancen von Hundelauten kann die Interpretation und Reaktion der Menschen auf die emotionalen und physischen Bedürfnisse von Hunden erheblich verbessern. Das könnte die Betreuung von Hunden verbessern und potenziell gefährliche Situationen verhindern. So könnten Hundehalter*innen künftig besser erkennen, wann ihr Hund spielen möchte oder wann er sich bedroht fühlt.

Gleich weiterlesen:

Folge ZEITjUNG auf FacebookTikTok und Instagram

Bild: Vecteezy; CC0-Lizenz