Hört sich ganz nach dir an: Mit MPEG-H Audio zum persönlichen TV-Klang

MPEG-H Audio liefert immersiven Klang, der sich sogar an persönliche Bedürfnisse anpassen lässt. Das macht Spaß und sorgt für mehr Barrierefreiheit im Fernsehen. Warum das in Brasilien bald Alltag wird und wie das innovative Audiosystem des Fraunhofer IIS funktioniert, erfahrt ihr hier.

Daniela Rieger Daniela Rieger
Veröffentlichung
Lesezeit
3 Minuten
Artikel anhören
Loading the Elevenlabs Text to Speech AudioNative Player...

Unser Medienkonsum hat sich dank Mediatheken und Streamingdiensten stark verändert. Wir wollen entscheiden, wann wir was sehen. Und auch unser Wiedergabesystem möchten wir selbst auswählen: Mal einen Film am Fernseher mit 5.1 Surround-System anschauen, dann wieder eine Doku am Laptop oder auch mal eine Serie auf dem Handy – und das am liebsten binaural über Kopfhörer.

In Anbetracht dieser vielen Optionen wünscht man sich gelegentlich, auch die Inhalte an die eigenen Wünsche anzupassen. Klar, dass wir die Handlung eines Films nicht verändern können. Aber den Dialog etwas anheben, ohne dass der gesamte Ton lauter wird? Solche Anpassungen sind tatsächlich möglich. Um sie flächendeckend anzubieten – und das bei Datenübertragungsraten, die auch für Streaming praktikabel sind – entstand unter maßgeblicher Beteiligung des Fraunhofer-Instituts für Integrierte Schaltungen IIS das MPEG-H Audio System.

Modernste Audiotechnologie für individuelle Erfahrungen

MPEG-H Audio ist ein Next Generation Audio (NGA) Codec, der neben immersivem Klang auch personalisierbare Audioinhalte nahtlos über alle Geräteklassen hinweg wiedergeben kann. Er ermöglicht die Produktion, Übertragung und Wiedergabe in jeder Kombination aus kanal-, objekt-, und szenenbasiertem Audio. Audio-Objekte sind in diesem System einzelne Klangelemente, die sowohl auf horizontaler als auch auf vertikaler Ebene mittels positionsbezogener Metadaten angeordnet werden. Durch die Übertragung von Audio- und zugehörigen Metadaten können die Inhalte bei der Wiedergabe flexibel an das jeweilige System angepasst werden. Dies ermöglicht die einfache Implementierung barrierefreier Angebote ebenso wie die Anpassung an den persönlichen Geschmack.

Video URL
Better Than Dolby Atmos? A Chat About MPEG-H - Michael G Wagner

Die dafür benötigten Optionen werden in einem neuen Schritt im Produktionsprozess erstellt: Beim sogenannten Authoring werden Metadaten wie die Sprache der Kommentierenden oder Interaktionsmöglichkeiten definiert und beim Export mit den Audiodaten in einer Datei gespeichert. So werden bei der Übertragung sämtliche Personalisierungs- und Auswahloptionen im selben Datenstrom mitgeführt, wobei dennoch niedrige Bitraten erreicht werden können. Diese Metadaten ermöglichen dann die Interaktion am Endgerät.

Das Authoring von MPEG-H Audio ist mit modernen DAWs möglich. Das System ist voll in Nuendo 13 integriert und wird auch von ProTools unterstützt.

Brasilien modernisiert die digitale Infrastruktur

Erste Erfahrungen hiermit konnte das Publikum in Brasilien schon machen. In einem aufwändigen Prozess wird dort gerade die gesamte TV-Infrastruktur modernisiert. Für das neue digitale Rundfunksystem TV 3.0 wurden zunächst eine Reihe von Kriterien definiert. Neben realistischem, immersivem Klang, der auf verschiedenen Gerätetypen wiedergegeben werden kann, umfassten diese auch ein hohes Maß an Nutzerfreundlichkeit, Interaktivität und Anpassbarkeit. Eine leicht zugängliche Audiodeskription und die Option, sie individuell im Raum zu positionieren, sowie die auf persönliche Präferenzen ausgerichtete Balance zwischen Dialog und Hintergrundgeräuschen soll Menschen mit Seh- oder Hörbehinderungen den Zugang zum Rundfunkprogramm erleichtern. In einer umfangreichen Evaluierung durch unabhängige Testlabore setzte sich MPEG-H Audio schließlich gegen die anderen Einreichungen durch und wurde 2021 zum verpflichtenden Audiostandard des neuen Systems.

Bei Globo in Recife (Brasilien) wird eine Sendung in MPEG-H Audio produziert.

Seit dieser Entscheidung testen und implementieren brasilianische Rundfunkanstalten das neue Audiosystem. Globo, die größte Mediengruppe Lateinamerikas, testete anspruchsvolle Live-Situationen mit der beliebten Konferenzschaltung am Feiertag São João do Nordeste. Die Veranstaltungsorte im Norden Brasiliens übertrugen die Audiosignale in den lokalen Globo-Hub in Recife, wo die TV-Produktion stattfand. Aus den eingehenden Signalen erstellte das Globo-Team einen 5.1+4H Immersive Sound Live-Mix. Kommentatoren, Publikum und Audiodeskription wurden als separate Audio-Objekte hinzugefügt. Damit wurden erweiterte Anpassungsoptionen für das TV-Publikum möglich. Ein besonders neuartiger Ansatz war die Echtzeit-Erstellung der Audiodeskription: Dazu wurden die Video- und Audiosignale nach São Paulo übertragen, wo die Audiodeskription live erstellt und nach Recife zurückgeschickt wurde, um dort in den Live-Stream integriert zu werden.

Das Globo-Team erstellte das Audiosignal mit vier Presets, aus denen das Publikum wählen konnte: eine Standardvoreinstellung, eine Version mit besser verständlichem Dialog, eine mit Audiodeskription und eine mit mehr Live-Atmosphäre. Schließlich wurden das Video und das MPEG-H Audio Signal encodiert und gleichzeitig in zwei Ausgabeformaten exportiert: Einem klassischen Broadcast-Signal und einen Live-Streaming-Service mit dem Common Media Application Format (CMAF) für HLS und DASH.

MPEG-H Audio wird den Ansprüchen der Branche an ein modernes, zukunftsfähiges Audiosystem vollends gerecht. Das zeigen mehrere Praxistests ebenso wie der umfangreiche Evaluierungsprozess in Brasilien. Die massiven Umbrüche und Modernisierungen, die momentan die Medienrezeption auf globaler Ebene verändern, machen an vielen Stellen Investitionen nötig. Diese zahlen sich jedoch mehrfach aus, wenn das Fernsehen der Zukunft neben hochauflösendem Video auch auf auditiver Ebene viele neue und sinnvolle Innovationen bieten kann, sowohl im Hinblick auf künstlerische Möglichkeiten als auch was Personalisierung und Inklusion betrifft.

Mehr zum Thema:

https://www.audioblog.iis.fraunhofer.com/tag/mpeg-h

www.mpegh.com

Daniela Rieger

Daniela Rieger ist spezialisiert auf audiovisuelle Medien und 3D-Audio und arbeitet seit 2020 am Fraunhofer IIS. Als Toningenieurin bearbeitet sie Themen wie MPEG-H Audio und Immersive Music. Ihre Masterarbeit zum Thema objektbasierte Musikproduktion gewann 2021 den 2. Preis beim ARD/ZDF Förderpreis „Frauen + Medientechnologie“. Sie ist weiterhin an der Forschung zu KI-basierten Technologien für barrierefreie Audioinhalte beteiligt. Seit 2022 ist Daniela Rieger Vizepräsidentin des Verbandes Deutscher Tonmeister e.V. (VDT).

Originalsprache: Deutsch
Artikelübersetzungen erfolgen maschinell und redigiert.