Data Story Finder – Künstliche Intelligenz unterstützt den Live-Kommentar
13.10.2021 – Wer live ein Fußballspiel kommentiert, muss multitaskingfähig sein: Das Spielgeschehen auf dem Platz muss nicht nur ständig im Blick behalten werden – das, was dort passiert, muss auch beschrieben und für die Zuschauenden in den richtigen Kontext eingeordnet werden. Um dabei Überraschungen, besondere Leistungen oder gar Rekorde nicht zu übersehen, gibt es nun Unterstützung durch Künstliche Intelligenz.
Das Wichtige immer im Blick behalten: Das Commentary Live System
Medienpartnern der DFL steht für die Spiele der Bundesliga und der 2. Bundesliga mit dem „Commentary Live System“ (CLS) ein spezielles Redaktionssystem zur Verfügung, das zahlreiche Informationen bereitstellt: Spieldaten und -statistiken, die Aufstellungen, Einzelheiten zu den Spielern wie die korrekte Aussprache ihrer Namen, verschiedene Rankings sowie Hintergrundwissen. All diese Informationen können die Kommentatorinnen und Kommentatoren in ihre Arbeit einfließen lassen; außerdem haben sie die Möglichkeit, vor den Spielen ihre eigenen Notizen im System zu hinterlegen.
Statistische Zusatzinformationen werden im Live-Ticker-Format angezeigt, wofür die Datenredaktion im Hintergrund relevante Spiel-, sowie Saison- und historische Statistikdaten aufbereitet. Alle diese zur Verfügung gestellten Daten helfen dabei, im Live-Kommentar das Geschehen auf dem Feld in größere Zusammenhänge einzubetten – etwa, ob oder wie häufig bestimmte Situationen schon einmal vorgekommen sind oder welche spielerischen Leistungen besonders hervorstechen.
Künstliche Intelligenz macht‘s möglich: Kontextdaten in Echtzeit
Die Bundesliga Match Facts powered by AWS stellen hierbei bereits einen großen Fortschritt im Sinne der Bereitstellung kontextbezogener Live-Daten dar. Mit Hilfe Künstlicher Intelligenz werden in Echtzeit Zusammenhänge, die für das Verständnis der Vorgänge auf dem Spielfeld relevant sind, erfasst, berechnet und visualisiert. Neu – und eine echte Innovation seit Beginn der Saison 2021/2022 – ist der von der DFL-Tochterfirma Sportec Solutions in Zusammenarbeit mit Amazon Web Services (AWS) entwickelte „Data Story Finder“. Diese zusätzliche Informationsquelle innerhalb des CLS beschleunigt die Bereitstellung von kontextbasierten Daten erheblich.
Mit Hilfe smarter Algorithmen sucht der Data Story Finder passende „Stories“. Das heißt, das System setzt die automatisiert erfassten Live-Spieldaten in Beziehung zu weiteren Spiel-, Saison-, oder historischen Daten und bietet die Ergebnisse dieses Abgleichs als zusätzliche Erkenntnisse der Datenredaktion an. Diese kann nach entsprechender Evaluierung die jeweilige Information in den Live-Ticker integrieren. Dabei entstehen einerseits spiel- sowie wettbewerbsbasierte Fakten und andererseits spieler- und teambasierte Erkenntnisse. Ein Beispiel ist die „Realformation“: Hier wird analysiert, ob eine Mannschaft gerade ihr Positionsspiel signifikant anders strukturiert als in der bisherigen Saison.
Millionen von Datenpunkten – in Echtzeit ausgewertet
Die Event- und Positionsdaten (letztere allein umfassen 3,6 Millionen Datenpunkte pro Spiel) werden von Sportec Solutions zur Verfügung gestellt und unter anderem zu den Bundesliga Match Facts weiterverarbeitet. Damit die Algorithmen diesen Schritt durchführen können, sind derzeit etwa 15 Story-Vorlagen definiert, die jeweils bestimmte Parameter auswerten und die Ergebnisse in einen vorformulierten Text einfließen lassen. Die Texte liegen deutsch und englisch vor, sodass auch ausländische Kommentatorinnen und Kommentatoren das System nutzen können.
So gibt es eine „Abschluss Effizienz“-Story, die anhand der Chancenauswertung einen eher glücklichen Sieg feststellen kann (beispielhafte Texteinblendung: „Während Mannschaft A 0,74 Tore weniger erzielte als erwartet, erzielte Mannschaft B 0,88 Tore mehr als erwartet.“) Eine „Most Pressed Player“-Story zeigt, welcher Spieler in Ballbesitzsituationen besonders oft vom gegnerischen Team unter Druck gesetzt wird, und wie sich dieser Wert zum Durchschnitt seines Teams verhält. Eine entsprechende Texteinblendung könnte zum Beispiel lauten: „Marco Reus war 25-mal unter Druck, 110 Prozent häufiger als der Durchschnitt von Borussia Dortmund“. Weitere Storys beziehen sich auf Pass-Profil, Angriffszonen oder Torwahrscheinlichkeit. Dieses Portfolio soll weiter ausgebaut werden, um noch mehr Kontext zu der Leistung der Spieler und Mannschaften zu liefern.