Jewiki unterstützen. Jewiki, die größte Online-Enzy­klo­pädie zum Judentum.

Helfen Sie Jewiki mit einer kleinen oder auch größeren Spende. Einmalig oder regelmäßig, damit die Zukunft von Jewiki gesichert bleibt ...

Vielen Dank für Ihr Engagement! (→ Spendenkonten)

How to read Jewiki in your desired language · Comment lire Jewiki dans votre langue préférée · Cómo leer Jewiki en su idioma preferido · בשפה הרצויה Jewiki כיצד לקרוא · Как читать Jewiki на предпочитаемом вами языке · كيف تقرأ Jewiki باللغة التي تريدها · Como ler o Jewiki na sua língua preferida

Elo-Zahl

Aus Jewiki
Zur Navigation springen Zur Suche springen
Schach
Go

Die Elo-Zahl ist eine Wertungszahl, die die Spielstärke von Go- und Schachspielern beschreibt.

Arpad Elo entwickelte das dahinter stehende objektive Wertungssystem 1960 für den US-amerikanischen Schachverband USCF. Es wurde 1970 vom Weltschachverband FIDE (auf dem Kongress in Siegen) übernommen.

Der Weltschachverband nennt sein System „FIDE rating system“. Eine Wertungszahl heißt offiziell „FIDE rating“, wird umgangssprachlich aber zumeist einfach als „Elo-Zahl“ bezeichnet. Neben dem internationalen Wertungssystem der FIDE existieren auch nationale Wertungssysteme mit unterschiedlichen Namen. In Deutschland heißt das nationale Wertungssystem DWZ, in Österreich werden (nationale) Elo-Zahlen berechnet und in der Schweiz gibt es eine Führungsliste mit Führungszahlen. Diese Systeme werten wesentlich mehr lokale Turniere aus, berechnen die Wertungszahlen aber ebenso nach den Methoden von Arpad Elo mit meist nur geringen Modifikationen und abweichenden Faktoren.

Berechnung

Wer beispielsweise gerade in den Schachklub eingetreten ist, hat noch keine Elo-Zahl. Nach einer Reihe von Partien gegen verschiedene Spieler wird seine Elo-Zahl zunächst eingeschätzt. Nach dieser Phase werden die tatsächlichen Ergebnisse der Partien für den Elo-Punktestand gewertet. Für die jeweilige Berechnung des neuen Elo-Stands ist die erwartete Punktezahl wichtig, die Spieler A gegen Spieler B voraussichtlich erreicht. Dabei gilt: für einen Sieg gibt es einen, für ein Unentschieden einen halben und für eine Niederlage keinen Punkt.

Anmerkung: Gäbe es kein Remis, so wäre die erwartete Punktezahl gerade die Wahrscheinlichkeit, dass A gewinnt. Da eine Schachpartie auch unentschieden enden kann, ist der erwartete Punktestand gleich der Wahrscheinlichkeit zu gewinnen plus einhalb mal der Wahrscheinlichkeit zu remisieren. Die Wahrscheinlichkeiten für Sieg, Remis und Niederlage werden im Elo-System gar nicht benötigt, sondern nur die Erwartungswerte.

EA: Erwarteter Punktestand für Spieler A. Bei einer Serie von 5 Spielen kann man auch EA mit 5 multiplizieren.
RA: bisherige Elo-Zahl von Spieler A
RB: bisherige Elo-Zahl von Spieler B

(Beträgt der Ratingunterschied mehr als 400 Punkte, so wird anstelle der tatsächlichen Differenz der Wert 400 benutzt.[1])

Der Erwartungswert für A beträgt nun EA · 100 %. Die neue Elo-Zahl von Spieler A ist

k: ist üblicherweise 15, bei Top-Spielern (Elo > 2400) 10, bei weniger als 30 gewerteten Partien 25, oder in neuester Zeit 30
SA: tatsächlich gespielter Punktestand (1 für jeden Sieg, 0,5 für jedes Unentschieden, 0 für jede Niederlage)
  • Anmerkung 1: Die in der Formel enthaltene Zahl 400 sowie der ursprüngliche k-Faktor wurden von Arpad Elo so gewählt, dass die Elo-Zahlen mit den Wertungszahlen des früher verwendeten Rating-Systems von Kenneth Harkness möglichst gut kompatibel sind. Tatsächlich kann man das Harkness-Modell als eine stückweise lineare Approximation an das Elo-Modell auffassen.
  • Anmerkung 2: Es lässt sich auf mathematischem Wege leicht zeigen, dass gilt.
  • Anmerkung 3: Die Gewinnerwartung des einen Spielers als Funktion der Punktedifferenz zum anderen ist in Elos Modell eine logistische Funktion. Um einem Missverständnis vorzubeugen: Das heißt jedoch nicht, dass die Spielstärken als logistisch verteilte Zufallsvariablen modelliert sind, dies ist nämlich nicht der Fall – die für Elos Modell charakteristische Eigenschaft der Erwartungswerte lässt sich aus keiner plausiblen Verteilungsannahme (wie etwa einer Normalverteilung) ableiten.

Ein (erfundenes) Beispiel

Der Schachspieler Garri Kasparow (Elo: 2806) spielt gegen die Schachspielerin Zsuzsa Polgár (Elo: 2577). Gemäß der ersten Formel erwartet man, dass Kasparow (Spieler A) gegen Polgar (Spieler B) im Mittel EA = 0,789 Punkte pro Spiel bekommt:

Nach einem Spiel gibt es drei Möglichkeiten.

Polgar gewinnt

Also SA = 0. Die neuen Elo-Punktestände R'A für Kasparow und R'B für Polgar sind

Kasparow büßt also acht Elo-Punkte ein, während Polgar acht Elo-Punkte gewinnt.

Kasparow gewinnt

Also SA = 1. Kasparow erhält zwei weitere Elo-Punkte, Polgar verliert zwei:

Unentschieden

Also SA = 0,5. Kasparow verliert drei Elo-Punkte, Polgar gewinnt drei:

Schach

Vor Einführung der Elo-Zahl stufte man die Spieler beim Schach in neun Klassen oder Kategorien ein. Ein Unterschied von einer Klasse bedeutete, dass der bessere Spieler als Ergebnis einer Partie 0,75 Punkte erwarten darf. Im Elo-System entspricht dieser Spielstärkeunterschied einer Differenz von (ziemlich genau) 200 Wertungspunkten.

Zuordnung der Titel nach der Wertungszahl
Elo-Zahl Kategorie Männer Kategorie Frauen
ab 2700 Super-Großmeister Super-Großmeister
2500–2699 Großmeister Großmeister
2400–2499 Internationaler Meister Internationaler Meister
2300–2399 FIDE-Meister Großmeister der Frauen (WGM)
2200–2299 Candidate Master oder Nationaler Meister Internationaler Meister der Frauen (WIM)
2100–2199 Meisteranwärter FIDE-Meister der Frauen (WFM)
2000–2099 Experte Candidate Master der Frauen (WCM))
1800–1999 Amateur, Klasse A, sehr guter Vereinsspieler
1600–1799 Amateur, Klasse B, starker Freizeitspieler
1400–1599 Amateur, Klasse C, überdurchschnittlicher Spieler
1200–1399 Amateur, Klasse D, durchschnittlicher Hobbyspieler
1000–1199 Gelegenheitsspieler
unter 1000 Anfänger

Zu beachten ist dabei, dass man die verschiedenen Titel Großmeister (GM) und Internationaler Meister (IM) nicht nur auf Grund einer bestimmten Elo-Zahl erhält, sondern durch die Erfüllung von anderen festgelegten Normen. Um den Titel nach Erfüllung aller Normen zu erhalten, muss ein angehender GM allerdings eine Elo-Zahl von mindestens 2500, ein IM eine Zahl von mindestens 2400 einmal erreicht haben. Die Anforderungen an Titel für Frauen liegen jeweils um 200 Elo-Punkte niedriger als an entsprechende Titel für Männer.

Der Umfang einer Klasse beträgt 200 Elo-Punkte. Das System ist so kalibriert, dass ein Unterschied von 200 Punkten einer Gewinnerwartung des stärkeren Spielers von 76 % entspricht, 400 Punkte entsprechen 92 % Gewinnerwartung. Der Vergleich beruht auf statistischen Verfahren. Bei 600 Punkten Unterschied gewinnt der stärkere Spieler praktisch-statistisch fast immer (98 %), und zwar obwohl die Spielstärke bei Menschen natürlich von der Tagesform und Motivation abhängt. Bei Computern ist die Verteilung nicht nur per 200-Punkte-Definition gleich, sondern auch vom Kurvenverhalten her darüber hinaus sehr ähnlich, allerdings gibt es bei ähnlich starken Maschinen eine weitere Spielstärkenspreizung in den verschiedenen Partiephasen.

Turnierkategorie

Auch Rundenturniere werden nach der durchschnittlichen Elo-Zahl der Teilnehmer in Kategorien eingeteilt. Hierbei entspricht ein Unterschied um eine Kategorie 25 Elo-Punkten. Als Turnier der Kategorie 1 wird dabei ein Turnier eingestuft, deren Teilnehmer im Schnitt 2250 bis 2274 Elo-Punkte haben. Die zur Zeit stärksten Turniere erreichen die Kategorie 21, was einem Schnitt von 2750 bis 2774 Elo-Punkten entspricht. Beim 3. Grand Slam Masters Final in Bilbao wurde im Oktober 2010 erstmals Kategorie 22 (mit einem Elo-Durchschnitt von 2788) erreicht.

Statistik

Das Elo-System teilt die Schachspieler mit Hilfe einer Wertungszahl in neun Klassen ein, wobei die untere Grenze der obersten Klasse bei 2600 und die obere Grenze der untersten Klasse bei 1200 liegt. Die Wertungszahlen eines einzelnen Spielers sind intervallskaliert und annähernd normalverteilt und schwanken mit einer Standardabweichung von 200 um einen mittleren Wert. Es gibt viele Spieler mit Spielstärken unter 1200, das Elo-System ist auf diesem Spielniveau in der Vorhersagesicherheit aber nur eingeschränkt gültig. Wichtig ist insbesondere auf Hobbyspielerniveau, dass ein Spieler seine Zahl auch gegen stärkere Gegner verteidigen kann, ohne sich auf besondere Eigenschaften wie unbewusste psychische Schwächen oder schlechtes Zeitmanagement von Neulingen konzentrieren zu müssen. Utopische hohe Werte werden durch Niederlagen schnell, exakt und zuverlässig korrigiert. Die recht stabile Elo-Zahl wird mit verschiedenen Verfahren ermittelt. Manche gehen von wenigen Spielen aus oder von ähnlich starken Turnierteilnehmern, nach vielen Partien erreichen alle sehr ähnliche Gleichgewichte.

Grundlage der Berechnung ist die Hypothese, die Verteilung der Spielstärke in der Gesamtheit der Spieler entspreche mathematisch der Normalverteilung (Gaußsche Glockenkurve). Ausgehend von dieser Hypothese lässt sich für zwei Gegner statistisch voraussagen, mit welcher Wahrscheinlichkeit der eine Spieler gewinnen wird. Im Sonderfall der identischen Wertungszahl sind die Wahrscheinlichkeiten gleich hoch. Bei einem Turnier lässt sich anhand der Wertungszahl eines Spielers und des Durchschnitts der Wertungszahlen seiner Gegner voraussagen, welche Punktzahl er wahrscheinlich erzielen wird. Nach Abschluss des Turniers wird das tatsächliche Ergebnis mit dem statistisch vorausgesagten Ergebnis verglichen und aus der Abweichung die neue Wertungszahl des Spielers errechnet.

Probleme von Rating-Systemen

Intransitivität von Wahrscheinlichkeitsrelationen

Ist Spieler A gegenüber Spieler B der Favorit und B gegenüber C, so besitzt A ein höheres Rating als B und B ein höheres als C. Damit besitzt A ein höheres Rating als C und müsste Favorit gegenüber C sein.

Diese Folgerung ist aber keineswegs zwingend, da Wahrscheinlichkeits- bzw. Präferenzrelationen nicht notwendigerweise transitiv sind. Dieses Problem ist natürlich keine Besonderheit des Elo-Systems, sondern ein prinzipielles Problem aller Rating-Systeme. (vgl. Condorcet-Paradoxon, „Chinesische Würfel“ oder „Intransitive Würfel“)

Transitivität ist jedoch eine notwendige Voraussetzung für ein sinnvolles Rating-System. Um diese Eigenschaft zu sichern, sind zusätzliche spezielle Annahmen zu treffen über die Wahrscheinlichkeits-Verteilungen der Spielstärken, die als Zufallsvariable zu interpretieren sind. Zu diesem Zweck setzte Arpad Elo bei der Entwicklung seines Rating-Systems als zusätzliche Hypothese eine quantitative Aussage bezüglich des Verhältnisses der Spielstärken von A und C voraus.

Lässt man einmal die Möglichkeit von Remis außer acht, so besagt die Grundidee des Elo-Systems, dass, wenn etwa Spieler A gegenüber Spieler B ein 3:1-Favorit (d. h. A gewinnt 75 % der Partien gegen B) ist und B gegenüber C ein 2:1-Favorit, so fordert bzw. folgt aus Elos Modell, dass A gegenüber C ein 6:1-Favorit ist. Ohne diese Voraussetzung bräuchte A nicht einmal der Favorit zu sein.

Allgemein: Ist A ein x:1-Favorit gegenüber B und B ein y:1-Favorit gegenüber C, so ist gemäß Elos Modell A ein xy:1-Favorit gegenüber C.

Dies kann man leicht nachrechnen – diese Forderung geht natürlich weit über die rein qualitative Aussage der Transitivität hinaus. Diese Multiplikativität ist aber keine Konsequenz aus einer Normalverteilung. Man liest zwar oft, dass das Elo-Modell von einer Normalverteilung ausgeht, doch genügt diese Annahme nur in sehr grober Näherung der Forderung nach Multiplikativität, sodass die Forderung nach Multiplikativität den besseren Ausgangspunkt für die Entwicklung des Modells darstellt – insbesondere für die Kalkulation der Spielstärken von Spielern früherer Epochen.

Deflation und Inflation

Will man mithilfe der Elo-Zahlen – oder anderer Ratings, dies betrifft nicht nur das Elo-System – die Stärken von Spielern aus unterschiedlichen Epochen vergleichen, so sollte ein Rating von z. B. 1600 aus dem Jahre 1970 gleichbedeutend mit einem Rating von 1600 aus dem Jahre 2000 sein. Insbesondere sollte, da sich infolge der Weiterentwicklung der Theorie die durchschnittliche Spielstärke im Laufe der Zeit zumindest nicht verschlechtert, sich die mittlere Ratingzahl nicht verringern.

Beim Elo-System gewinnt der Sieger einer Partie genau so viele Rating-Punkte hinzu, wie der Verlierer einbüßt: die mittlere Spielstärke beider bleibt gleich. Umfasst der Ratings-Pool nur Spitzenspieler, so ist folgendes Phänomen zu beobachten: Sooft ein Spieler neu in die Ratings aufgenommen wird, tritt er mit einer gewissen (niedrigen) Punktezahl ein. Im Laufe seiner Karriere verbessert er seine Stärke, gewinnt Punkte hinzu, und scheidet später mit einer (hohen) Punktezahl aus – dadurch werden der Gesamtheit Punkte entzogen, und die mittlere Ratingzahl sinkt; d. h. das System ist deflationär.

Vergrößert man den Ratings-Pool, so tritt der entgegengesetzte Effekt auf: Viele Spieler verlassen den Ratings-Pool mit einem niedrigeren Rating, als ihnen bei Eintritt zugemessen wurde – das System wird nun inflationär.

Dies war insbesondere früher der Fall, als der Weltschachbund FIDE Schachspieler erst ab einer Wertungszahl von 2200 in die Rangliste aufnahm. Da die Elo-Auswertung von Turnieren gebührenpflichtig ist und damit für die FIDE eine Einnahmequelle darstellt, wurde diese Schwelle immer weiter herab gesenkt, zuletzt im Juli 2009 auf 1200.[1] Dennoch lässt es sich nicht vermeiden, dass viele Spieler den Ratings-Pool mit niedrigeren Wertungszahlen verlassen als sie bei Eintritt erhielten. Eine maßvolle Inflation ist jedoch durchaus erwünscht, diese sollte in ihrem Ausmaß der Weiterentwicklung der Spielstärken im Laufe der Zeit Rechnung tragen, allerdings ergibt sich hier zumeist das Problem einer zu großen Inflation.

So konnten die Elo-Zahlen immer neue Rekorde erreichen, ohne eigentlich noch ein Maß für die Spielstärke absolut zu sein. Vor ca. 20 Jahren gab es nur zwei Spieler mit einer Elo-Zahl größer 2700, und nur ca. 10–20 Spieler erreichten einen Wert über 2600. Heute (Stand Juli 2010) haben über 200 aktive Spieler eine Elo-Zahl größer 2600, davon 37 mindestens 2700; drei Spieler haben sogar eine Elozahl von 2800 oder höher, was vor 20 Jahren undenkbar schien.

Das Tausend-Partien-Problem

Ein weiteres Phänomen ist das sogenannte Tausend-Partien-Problem. Oft treffen Spieler der gleichen Spielstärke immer wieder aufeinander. Angenommen, zwei Spieler mit Elo 2000 spielen zehn Partien, bei denen der eine 80 % der Punkte erreicht. Nach der Berechnung der neuen Elo-Zahl ergeben sich die Werte 2080 für den Sieger und 1920 für den Verlierer. Tragen die beiden Spieler jedoch 1000 Partien mit gleichem Punkteverhältnis aus, ohne dass die Wertung aktualisiert wird, so ergibt sich für den Sieger eine neue Wertungszahl, die höher als die des aktuellen Weltmeisters ist. Jedoch ist dieses Szenario ziemlich konstruiert. Nach dem Statistikgesetz der großen Zahl darf man erwarten, dass die beiden gleich starken Spieler (beide hatten ja Elo 2000) sich nach vielen Partien den zu erwartenden 50 % annähern. Weiterhin wird es in der Praxis nie 1000 Partien ohne Ratingaktualisierung geben.

Die Entwicklung der Wertzahlen wird auch von der Auswertungsperiode beeinflusst. Bis 2002 wurde halbjährlich, bis 2009 vierteljährlich ausgewertet. Seit Juli 2009 wird alle zwei Monate ausgewertet.[1] Sinnvoll wäre prinzipiell eine Auswertung nach jedem Turnier, da so Formschwankungen von Spielern besser ausgeglichen werden können. Allerdings ist das derzeit nicht geplant.

Spielstärken ausgewählter Schachspieler

Der ehemalige Schachweltmeister Garri Kasparow erreichte 1999 die bisher unübertroffene Elo-Zahl von 2851 Punkten. Nach Einführung der Elo-Zahl im Jahr 1970 hatte zunächst Bobby Fischers Bestmarke von 2785 (vom Juli 1972) für lange Jahre Bestand.

Großmeister kommen normalerweise auf eine Elo-Zahl von mindestens 2500, ab 2600 Punkten kann man von der erweiterten Weltspitze sprechen. Den Stand November 2011 der FIDE-Auswertung zeigt die folgenden Tabelle mit den zwanzig am höchsten bewerteten aktiven Spielern, ergänzt um die beste Frau und die besten männlichen und weiblichen Spieler aus Deutschland, Österreich und der Schweiz (in Klammern: Platz in der Frauenrangliste):

Rang Name Rating Land
1 Magnus Carlsen 2826 NorwegenNorwegen Norwegen
2 Viswanathan Anand 2811 IndienIndien Indien
3 Lewon Aronjan 2802 ArmenienArmenien Armenien
4 Wladimir Kramnik 2800 RusslandRussland Russland
5 Teymur Rəcəbov 2781 AserbaidschanAserbaidschan Aserbaidschan
6 Wassyl Iwantschuk 2775 UkraineUkraine Ukraine
7 Wesselin Topalow 2768 BulgarienBulgarien Bulgarien
8 Sergei Karjakin 2763 RusslandRussland Russland
9 Alexander Morosewitsch 2762 RusslandRussland Russland
10 Hikaru Nakamura 2758 Vereinigte StaatenVereinigte Staaten Vereinigte Staaten
11 Vüqar Həşimov 2757 AserbaidschanAserbaidschan Aserbaidschan
12 Peter Swidler 2755 RusslandRussland Russland
13 Alexander Grischtschuk 2752 RusslandRussland Russland
14 Boris Gelfand 2744 IsraelIsrael Israel
15 Jewgeni Tomaschewski 2740 RusslandRussland Russland
16 Wang Hao 2736 China VolksrepublikVolksrepublik China Volksrepublik China
17 Michael Adams 2734 EnglandEngland England
18 Şəhriyar Məmmədyarov 2733 AserbaidschanAserbaidschan Aserbaidschan
19 Gata Kamsky 2732 Vereinigte StaatenVereinigte Staaten Vereinigte Staaten
20 Jan Nepomnjaschtschi 2730 RusslandRussland Russland
31 Arkadij Naiditsch 2712 DeutschlandDeutschland Deutschland
35 (1) Judit Polgar 2710 UngarnUngarn Ungarn
82 Markus Ragger 2662 OsterreichÖsterreich Österreich
98 Vadim Milov 2653 SchweizSchweiz Schweiz
1245 (35) Elisabeth Pähtz 2457 DeutschlandDeutschland Deutschland
1342 (37) Eva Moser 2448 OsterreichÖsterreich Österreich
9850 (408) Barbara Hund 2215 SchweizSchweiz Schweiz


Historische Elo-Zahl im Schach

Für den Vergleich heutiger Spitzenspieler mit Großmeistern vor der Einführung der Elo-Zahl wird die sogenannte Historische Elo-Zahl verwendet.

Computerschach

Diese Elo-Zahlen sind nicht ohne weiteres mit denen menschlicher Schachspieler zu vergleichen, da sie überwiegend durch Partien zwischen Computern ermittelt wurden und nicht durch Teilnahme an offiziellen Turnieren.

Go

Bei Go wird die Spielstärke traditionell in Kyu- (Schüler) und Dan-Graden (Meister) angegeben. Die Ermittlung dieser Spielstärke basiert innerhalb der European Go Federation und bei vielen Go-Servern im Internet auf einem von Elo abgeleiteten System, welches Kyu und Dan Grade wie folgt abbildet:

kyu / dan Elo Spielstärke und -erfahrung
30k   Regeln verstanden, aber noch keine Partie gespielt
29k – 28k   einige Partien gespielt
27k – 25k   einige Partien gegen Anfänger gewonnen
24k – 22k   einige Partien gegen Nicht-Anfänger gewonnen
21k – 18k 0 – 349 Hobby-Spieler
17k – 14k 350 – 749 regelmäßiger Hobby-Spieler
13k – 10k 750 – 1149 Club-Spieler
9k – 5k 1150 – 1649 regelmäßiger Club-Spieler
4k – 1k 1650 – 2049 guter Club-Spieler
1d – 3d 2050 – 2349 sehr guter Club-Spieler
4d – 7d ab 2350 einer der besten Spieler seines Landes
1p – 9p ab circa 2600 professioneller Go-Spieler (aus Japan, Korea oder China), der stärker als ein Amateur-6dan spielt

Fußball

Eine Adaption des Elo-Systems für Männernationalmannschaften im Fußball sind die World Football Elo Ratings.

Tischtennis

Der Schweizerische Tischtennisverband STT nutzt seit der Saison 2010/2011 eine etwas modifizierte Elo-Formel zur Berechnung von Wertungspunkten[2]

EA: Erwarteter Punktestand für Spieler A.
RA: bisherige Punkte-Zahl von Spieler A
RB: bisherige Punkte-Zahl von Spieler B

Der Erwartungswert für A beträgt nun EA · 100 %. Die neue Punkte-Zahl von Spieler A ist

SA: tatsächlich gespielter Punktestand (1 für jeden Sieg, 0 für jede Niederlage, Remis ist im Tischtennis nicht möglich)

Weblinks

Einzelnachweise

  1. 1,0 1,1 1,2 Changes in the Rating Regulations from 1.7.2009 Auf: fide.com, 15. Juli 2009
  2. elo_explications_d.pdf (abgerufen am 28. September 2010)
Dieser Artikel basiert ursprünglich auf dem Artikel Elo-Zahl aus der freien Enzyklopädie Wikipedia und steht unter der Doppellizenz GNU-Lizenz für freie Dokumentation und Creative Commons CC-BY-SA 3.0 Unported. In der Wikipedia ist eine Liste der ursprünglichen Wikipedia-Autoren verfügbar.