Prognoseforschung WM 2026 – auch eine Meisterschaft der KI

Quelle: Universität zu Köln 2 min Lesedauer

Anbieter zum Thema

Forschende haben ein Vergleichstool entwickelt, das Vorhersagen zu Spielen der Fußball-Weltmeisterschaft analysiert. Im Fokus steht die Frage, wie gut große Sprachmodelle (LLMs) wie Chat-GPT, Claude oder Gemini reale Spielergebnisse prognostizieren.

Die WM 2026 wird auch zum Prüfstand für KI: Wie gut tippen große Sprachmodelle den Spielausgang?(Bild:   /  Pixabay)
Die WM 2026 wird auch zum Prüfstand für KI: Wie gut tippen große Sprachmodelle den Spielausgang?
(Bild: / Pixabay)

Die Plattform LLM SoccerArena bildet dafür eine Live-Rangliste: Während der WM 2026 geben führende KI-Modelle für jedes Spiel ihre Tipps ab. Anschließend wird überprüft, wie nah diese Vorhersagen an den tatsächlichen Ergebnissen liegen. Das Prinzip ähnelt einem Tippspiel – mit dem Unterschied, dass hier KI-Systeme gegeneinander antreten.Entwickelt wurde das Projekt von Markus Weinmann (Universität zu Köln, Institute for Business AI) gemeinsam mit Oliver Müller (Universität Paderborn) und Stefan Feuerriegel (LMU München, MCML). 

Warum eignet sich Fußball für den KI-Test?

Fußball dient dabei als realitätsnaher Test: Ergebnisse sind eindeutig, öffentlich und im Voraus unbekannt. Genau das macht ihn geeignet, um die Prognosefähigkeit von KI-Modellen unter realen Bedingungen zu prüfen. Zusätzlich untersuchen die Forschenden, ob Modelle bessere Vorhersagen treffen, wenn sie vorab auf aktuelle Informationen aus dem Internet zugreifen können.Vor jedem Spiel geben die Modelle eine Prognose ab: das exakte Ergebnis sowie Wahrscheinlichkeiten für Sieg, Unentschieden oder Niederlage. Alle Vorhersagen werden vor Anpfiff mit Zeitstempel gespeichert und anschließend mit dem offiziellen Ergebnis verglichen. Die Resultate fließen in eine laufend aktualisierte Rangliste ein.
Die Bewertung erfolgt nach einem klaren Punktesystem (5 Punkte für das exakte Ergebnis, 2 Punkte für die richtige Tordifferenz, 1 Punkt für die richtige Tendenz, 0 Punkte für einen Fehltipp). Zusätzliche Turnierfragen werden separat bewertet.

Was sagt die Platzierung über die Modelle aus?

Neben den Ergebnissen analysiert das Forschungsteam auch die Qualität der Wahrscheinlichkeitsangaben – ein Standardverfahren in der Prognoseforschung. Details dazu sind auf der Website dokumentiert. Zudem wird transparent festgehalten, ob ein Modell externe Informationen genutzt hat oder nicht.
Wichtig: Eine gute Platzierung zeigt nur, wie treffsicher ein Modell bislang war. Sie ist kein Beweis für echtes „Verständnis“ von Fußball und erlaubt keine sicheren Vorhersagen für zukünftige Spiele. Gerade zu Beginn des Turniers kann sich die Rangliste noch stark verändern.
 

Die Ergebnisse sind auch für Unternehmen relevant: Sprachmodelle werden zunehmend genutzt, um Informationen auszuwerten, Entwicklungen einzuschätzen und Entscheidungen vorzubereiten. Dafür müssen sie nicht nur Daten verarbeiten, sondern auch Unsicherheiten bewerten und fundierte Prognosen ableiten.

Die im Projekt generierten Vorhersagen dienen ausschließlich der Forschung und stellen keine Wettempfehlungen dar.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung