Wenn Borussia Dortmund den Daten vertraut hätte, wäre Jürgen Klopp vielleicht heute noch BVB-Trainer. Oder zumindest wäre er wohl etwas länger geblieben als bis zum Sommer 2015. Das ist eine gewagte These, aber die Geschichte dahinter erzählt ein wenig von der fortschreitenden Digitalisierung des Profifußballs.
Als der BVB in der Hinrunde der Saison 14/15 also völlig unerwartet in den Tabellenkeller der Bundesliga abstürzt, erstellt der Blogger Colin Trainor für die Homepage «statsbomb.com» eine Analyse. Der Wirtschaftsprüfer kommt zu der Einschätzung, dass Klopps Mannschaft 25 statt 17 Tore hätte schießen müssen. Sie hätte auch nur 17 Treffer kassieren sollen statt 26. Das Resultat: Der BVB hätte nach 17 Spieltagen auf dem vierten Platz stehen müssen – und nicht auf dem vorletzten.
All das hat ihm ein Modell der Expected Goals (xG) erzählt. Dieses Modell fasst – vereinfacht ausgedrückt – all die Abschlüsse zusammen, die eine Mannschaft im Laufe eines Spiels abgibt und mit welcher Wahrscheinlichkeit sie ins Tor gegangen wären. Als Grundlage dafür dienen die Zahlen aus einer Datenbank unzähliger vorheriger Spiele. Daraus ergibt sich ein xG-Gesamtwert.
Trainors Schlussfolgerung lautet: Der BVB hatte über längere Zeit ungewöhnlich großes Pech und hätte mehr Tore und somit auch mehr Punkte haben müssen. In der Rückrunde ist das Pech weg und die Borussia schafft es sogar noch in den Europapokal. Die Trennung von Klopp ist da aber schon verkündet.
Nicht nur Glück und Pech lassen sich berechnen
Es ist nur eine Geschichte von vielen, aber sie handelt vom Einfluss der Daten auf den Fußball. xG-Werte werden den Zuschauern heutzutage längst in den Bundesliga-Übertragungen der Fernsehsender angezeigt. Trainer bereiten ihre Mannschaften mit Metriken wie Raumkontrolle oder Pressingindex auf die nächsten Gegner vor. Nicht nur Glück und Pech lassen sich berechnen, sondern mithilfe des Computers kann auch der ideale Neuzugang für die eigene Mannschaft gefunden werden. All das dank Big Data, der Fußball ist längst zu einem Datenspiel geworden. Oder?
«Ich habe diese Datenflut zum ersten Mal erlebt, als ich 2014 Trainer beim FC Fulham in England war», sagt Felix Magath, der das Thema kritisch sieht. «Der Trugschluss ist, dass Daten irgendetwas aussagen können. Denn das Dumme ist ja, dass Fußball immer noch von Menschen gespielt wird. Und wir sind nun mal jeden Tag anders.» Er wisse gar nicht, was derzeit alles an Daten zur Verfügung stehe, sagt der 70-Jährige: «Aber in jedem Fall zu viel.» Man könne Daten vorlegen, wie man wolle. «Aber es gibt eine Information, die Tabelle: Die lügt nicht», sagt Magath.
Hatte Colin Trainor also unrecht? Es gibt nicht wenige Menschen, die es ganz anders sehen als Magath. Im Grund genommen sind das alle großen Vereine. In jedem Bundesliga-Stadion hängen längst etliche Trackingkameras, die pro Spiel 3,6 Millionen Positionsdatenpunkte aufzeichnen. Das heißt: Nicht eine einzige Bewegung von Spielern oder Ball bleibt unbeobachtet. Diese Rohdaten werden den Bundesligisten schließlich von der Deutschen Fußball Liga (DFL) teilweise live zur Verfügung gestellt. Neben jedem Cheftrainer sitzen auf der Bank Analysten, die ihn per Tablet damit versorgen können. Aber was aus diesem Zahlenwust hilft einem wirklich, ein Spiel zu gewinnen?
«Angekommene Pässe, gelaufene Kilometer einer Mannschaft, Ballbesitz, all die einfachen Metriken, die haben überhaupt keine Aussagekraft, um zu wissen, welche Mannschaft ein Fußballspiel gewinnt oder verliert», sagt der Sportwissenschaftler Daniel Memmert vom Institut für Trainingswissenschaft und Sportinformatik der Sporthochschule Köln. Ein Beispiel: Beim legendären WM-Halbfinale der deutschen Nationalmannschaft 2014 gegen Brasilien ist die Seleção in vielen dieser einfachen Metriken besser. Trotzdem gewinnt am Ende die DFB-Auswahl mit 7:1.
Einige Bundesligisten arbeiten mit Statistikern
Wissenschaftlich belegt von Memmert und seinem Team ist dagegen, dass die Siegchance für die Mannschaft steigt, die im gegnerischen 30-Meter-Bereich über die bessere Raumkontrolle verfügt. Auch das Team, das besser presst, hat größere Chancen zu gewinnen. «Komplexere Metriken schaffen diese Aussagekraft», sagt Memmert.
All solche Dinge lassen sich heutzutage berechnen. Nicht nur ein Spitzenclub wie Champions-League-Sieger Manchester City beschäftigt längst Astrophysiker oder andere Wissenschaftler, um aus den vorhandenen Daten genau das zu filtern, was Trainer Pep Guardiola letztlich nützt. Auch einige Bundesligisten arbeiten mit Mathematikern oder Statistikern. Neben den DFL-Daten beziehen die meisten Vereine zusätzlich Daten von externen Anbietern wie Stats Perform oder Impect. Fürs Scouting möglicher Neuzugänge gibt es nochmals andere Computerprogramme. All das kostet die Bundesligisten sechsstellige Beträge pro Saison.
Und dies ist nur ein minimaler Ausschnitt eines riesigen Geschäftsbereichs. In der englischen Premier League haben sich einige Clubs vor Jahren sogar einige dieser externen Anbieter gekauft, um deren Daten exklusiv zur Verfügung zu haben. «Natürlich hat das Ganze auch mit Geld zu tun. Einer, der viel Geld hat, kann sich Unmengen an Daten und natürlich auch die besten Spieler kaufen», kritisiert Magath. «Wenn man dann am Ende gewonnen hat, kann man natürlich sagen, es waren die Daten.» Auf der anderen Seite wäre sein Kollege Jürgen Klopp vielleicht noch länger BVB-Trainer geblieben, hätte man ebenjenen Daten vertraut.