Die Datenfeeds der STS liefern immer detailliertere Spielinformationen
28.11.2024 – Die DFL setzte schon früh auf den Einsatz von Daten im deutschen Fußball und gründete 2016 gemeinsam mit Deltatre die Sportec Solutions GmbH (STS) als Kompetenzzentrum für Spieldaten und Sporttechnologien. Mit ihrem DFL Data Hub schuf die STS ein Online-Informationssystem, das die offiziellen Spieldaten der Bundesliga und 2. Bundesliga sammelt, veredelt und ausliefert.
Ausgehend vom Data Hub werden die Clubs, ihre Performance- und Medien-Abteilungen sowie die Medienpartner der DFL laufend mit Datenfeeds von allen Spielen der Bundesliga und 2. Bundesliga sowie des Supercups beliefert. Diese Feeds dienen einerseits als Ausgangsbasis für entsprechende Services von Medien wie Statistikeinblendungen, Live-Ticker und grafische Auswertungen von Spielszenen; andererseits erhalten die Clubs auf diesem Weg wertvolle, detaillierte Informationen, mit deren Hilfe unterschiedliche Rückschlüsse gezogen werden können, beispielsweise auf Spieltaktik und -strategie, Trainingsprogramme und individuelle Spielerentwicklung.
Neue Technologieentwicklungen ermöglichen eine immer präzisere und schnellere Auswertung von Spielen, ob in Echtzeit während der Partie oder im Nachgang. Das Portfolio dieser Feeds – es gibt bereits über 30 davon – wird daher laufend qualitativ und quantitativ verbessert und weiter ausgebaut. So stellt die STS seit der Saison 2024/25 einen neuen, kombinierten Event- und Positionsdatenfeed bereit, der den Clubs eine Fülle zusätzlicher Spielinformationen bietet.
Ordnung in der Datenflut
Feeds sind einfache Text-Strings im XML-Format, die erst durch geeignete Software in für Menschen verständliche Form gebracht werden, zum Beispiel als Texte, Grafiken oder Statistiken. Der „einfachste“ unter ihnen ist der Stammdaten-Feed mit den weitgehend gleichbleibenden Informationen über Clubs, Kader und den Spielplan. Der Feed „Spielinformationen“ fasst die Daten zu einem konkreten Spieltag zusammen, etwa die Aufstellungen der Mannschaften und die Schiedsrichter.
Dynamischer wird das Bild bei den Spielereignisdaten- und Positionsdaten-Feeds, die das Spielgeschehen mit spezifischen Parametern erfassen. Darin enthalten sind beispielsweise Torschüsse, Eckstöße, Freistöße, Zuspiele oder Einwürfe sowie Laufgeschwindigkeiten, Laufdistanzen, Ballbesitz oder Spielerpositionen. Rohdatenfeeds enthalten sämtliche erfassten Daten, während die aufbereiteten Feeds auf bestimmte Themen und Nutzergruppen zugeschnitten sind.
Wozu braucht man so viele Datenfeeds?
„Die schiere Menge der während eines Spiels erhobenen Daten ist enorm, durchschnittlich sind es 3,6 Millionen Datenpunkte pro Spiel. Letztlich wird jede Bewegung jedes Spielers und des Balls erfasst,“ erklärt Julian Schmitz, Strategic Account Manager bei der Sportec Solutions AG. „Spielereignis- und Positionsdaten werden auf unterschiedliche Weise erfasst. Um die gezielte und zweckmäßige Nutzung all dieser Daten zu erleichtern, werden sie je nach Bedarf veredelt und auf zahlreiche themenspezifische Feeds verteilt.“
Die Identifizierung der Spielereignisse auf dem Feld erfolgt manuell: Eine Kommentatorin oder ein Kommentator im Stadion beschreibt das Live-Spiel in einer codierten Sprache, eine Mitarbeiterin oder ein Mitarbeiter im Sportec Solutions Collection Centre gibt diese Ereignisse in Echtzeit in das System ein. Dahingegen ist die Positionsdatenerfassung bereits ein voll automatisierter Prozess: „Bis zu 16 im Stadion verteilte Spezialkameras behalten ständig alle Akteure und den Ball im Blick“, erklärt Lukas Glöckner, Leiter Technologie & Innovation bei der DFL. „Diese Informationen laufen im zentralen Server zusammen, und daraus wird durch Triangulation, also durch eine Einordnung aus mehreren Perspektiven, die Position jedes Spielers 25 Mal pro Sekunde neu berechnet.“
Neuer Feed: „Erweiterte Ereignisse“
Der neu eingeführte Feed „Erweiterte Ereignisse“ kombiniert und synchronisiert erstmals die Inhalte des Ereignisdatenfeeds mit denen des Positionsdatenfeeds. „Beispielsweise werden zu jedem Torschuss auch der Druck auf den Spieler, der Expected-Goals-Wert, der Winkel zum Tor, die Schussdistanz und viele weitere Details angegeben“, erläutert Schmitz. „Alle Ereignisse werden zu einem umfassenden Gesamtbild zusammengefügt und die Aussagekraft somit deutlich erhöht.“
Bei der Synchronisierung kommt ein Machine-Learning-Ansatz zur Anwendung. Hierzu wurde eine Reihe neuronaler Netze nach dem „Deep Learning“-Prinzip trainiert. Der Feed begleitet das gesamte Spiel und wird live jede Minute aktualisiert.
Mehrwert für die Clubs
Den Performance-Abteilungen der Clubs biete dieser neue Feed mit seiner hohen Informationsdichte enormen Mehrwert. Bei der Auswertung von Zuspielen etwa erfahren die Experten gleich auch die Spielerkoordinaten, die Zuspielrichtung und den -winkel, wie viele Verteidiger überspielt wurden, wie hoch der Druck auf den Passgeber und -empfänger war, die Erfolgswahrscheinlichkeit des Passes (xPass) und ob das Zuspiel erfolgreich war.
All diese Erkenntnisse mussten sich die Clubs in der Vergangenheit selbst erarbeiten. Der neue Feed erspart ihnen diesen Aufwand und liefert zudem ein detaillierteres Bild jedes Ereignisses auf dem Spielfeld. „Das jeweilige Ereignis wird so in einen größeren Kontext eingebettet – genau diese Gesamtschau ist es, die den Mehrwert für die Clubs ausmacht,“ so Lukas Glöckner.