|
En tant que joueur par email, je me suis inévitablement intéressé à
l'AJEC (Association des Joueurs d'Échecs par Correspondance) et
notamment à son système de classement, le Bridier. Le principe de base
de ce système est ne pas prendre en compte les parties nulles. L'idée
est mauvaise en soi, parce qu'une conséquence pratique est que la
fierté légitime d'un faible joueur qui réussit à annuler contre un
très fort joueur est sans effet. Plus encore, le fort joueur dans
cette situation réalise une notable contre-performance mais ce n'est
pas grave, ça ne compte pas. Ceci est seulement un fait de nature
psychologique, mais ce n'est malheureusement pas tout ...
Cet article a pour objet de prouver que ce système pèche justement
où il prétend être le plus judicieux, sur le sujet des parties nulles
qu'il nie alors qu'elles sont nécessaires pour établir une loi qui
"colle" à la réalité. La preuve est fournie par une analyse théorique
(paragraphe 4) ainsi qu'une analyse
statistique (paragraphe 5).
| 2-Résumé des bases du système ELO |
Le système ELO est basé sur l'hypothèse que chaque joueur est "représenté" par sa force (ELO) agrémentée d'un écart type pris arbitrairement égal à 200 suivant une loi normale de Laplace-Gauss. Il faut noter que c'est la seule faiblesse du système ELO, puisque logiquement un joueur très régulier devrait avoir un petit écart type et inversement un joueur irrégulier devrait en avoir un grand. En fait, cette hypothèse est prise pour simplifier les calculs. L'espérance mathématique d'un joueur est alors fonction du seul écart en point ELO entre lui et son adversaire. De par sa nature, cette loi mathématique est difficile à calculer, mais heureusement il existe une loi logarithmique assez simple qui donne une approximation très satisfaisante (moins de 2 points) jusqu'à environ 250 points d'écart. La voici :
P = 1/(1+10^(-E/400)) où P est l'espérance mathématique du joueur (i.e. le nombre de points moyens qu'il est censé obtenir) et E l'écart en points avec son adversaire.
Exemple pratique : un joueur classé 2200 joue contre un 2100 ; E = 100 et P = 0,64 ; sur 100 parties, le joueur classé 2200 est supposé marquer 64 points.
C'est cette loi que j'utiliserai par la suite.
| 3-Résumé des bases du système Bridier |
Juste une copie des deux articles "fondateurs" du système :
ARTICLE 2 - SYSTEME DE CLASSEMENT.
Le système officiel de l'AJEC est le système Bridier. C'est un classement
par points où chaque joueur dispose d'un capital-points correspondant à sa
valeur échiquéenne (CPB). Ce capital-points est assorti d'un indice de
fiabilité. Avant publication, le CPB (CP-Bridier) est transformé en CPA
(CP-Ajec) par la formule :
CPA = (CPB x 1,7) + 1000.
Cette formule pourra être modifiée si une étude statistique en montrait la
nécessité, la valeur du CPA devant être proche de la valeur de l'ELO-ICCF.
ARTICLE 6 - ENJEUX.
Les enjeux sont les points qui, à chaque partie non nulle, s'ajoutent au
CPB du gagnant et se retranchent du CPB du perdant.
Sauf les cas particuliers prévus à l'article 7, le montant de l'enjeu est
le même pour les deux joueurs et fixé comme suit :
- Si le plus faible gagne, l'enjeu est de 10 ;
- Si le plus fort gagne, l'enjeu est fonction de l'écart entre le CPB des
deux joueurs arrondi au chiffre supérieur figurant dans le barème suivant :
| Ecart
: | 0 | 10 | 20 | 30 | 40 | 60 | 80 | 100 | 140 | 200 | >200 |
| Enjeu : | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 0 |
C'est un barème logarithmique : chaque fois que l'écart augmente de 60,
l'enjeu est réduit de moitié.
Ces deux articles s'appliquent dans le cas général de deux joueurs
dont le classement est fiable, je renvoie au site de l'AJEC pour les détails.
Pour conduire mon raisonnement, je vais supposer que la loi de conversion ELO = ( CPB * k ) + A est juste. En l'occurence, pour le système Bridier k = 1,7 et A = 1000 (article 2). Je suppose également que la loi définissant l'enjeu e (article 6) est bien logarithmique avec une division par 2 de l'enjeu tous les 60 CPB. Soit a, b et c respectivement les proportions de parties gagnées, nulles et perdues par un joueur dont l'écart en point est E avec son adversaire dans le système ELO. Je vais établir une relation entre b le taux de parties nulles et k le coefficient mentionné ci-dessus qui montre clairement l'incompatibilité des deux systèmes ELO et Bridier.
On peut établir que e = 10 * 10 ^ ( - B / 200 ) où B représente l'écart dans le classement Bridier. Si E est l'écart correspondant dans le système ELO, on a E = k * B et donc e = 10 * 10 ^ ( - E / ( 200 * k ) )
Or la formule ELO donne P = 1 / ( 1 + 10 ^ ( - E / 400 ) ). Cette espérance mathématique se traduit par P = a * 1 + b * 0,5 + c * 0 [équation n°1] suivant la définition que j'ai faite de a, b et c.
D'autre part, pour que le "jeu" soit équilibré, on a nécessairement a * e = c * 10 [équation n°2].
Reste une dernière équation évidente par définition : a + b + c = 1 [équation n°3].
Les trois équations ci-dessus constitue un système de 3 équations à 3 inconnues, système qui admet une solution unique quand elle existe, ce qui est le cas ici. On montre entre autres que :
a + c = th ( E / 800 ) / th ( E / ( 400 * k ) )
(th est la fonction tangente hyperbolique)
Or quand x tend vers 0, th(x) / x tend vers 1, donc a + c tend vers E / 800 * 400 * k / E quand E tend vers 0. Toute simplification faite on montre que :
a + c tend vers k / 2 quand E tend vers 0.
et donc
b tend vers 1 - k / 2 quand E tend vers 0.
A noter que l'approximation faite reste valable pour des valeurs relativement grande de E. De plus la fonction 1 - th ( E / 800 ) / th ( E / ( 400 * k ) ) est décroissante. On peut donc écrire
b =< 1 - k / 2 ou k =< 2 * ( 1 - b ), avec égalité quand E tend vers 0.
La relation entre b et k est ainsi établie. Maintenant faisons intervenir les statistiques. Prenez n'importe quelle base de données de parties, pourvu que le nombre de parties soit important. Vous constaterez que le taux de parties nulles est voisin de 40% et presque toujours supérieur à 30%, ce qui correspond à une valeur de k =< 1,2 (si on prend 30% on a k =< 1,4). Le coefficient k = 1,7 affiché par le système Bridier suppose que le taux de parties nulles est inférieur à 15%, ce qui est notoirement faux.
Afin de complèter cette analyse, j'ai réalisé l'étude statistique simple qui consiste à effectuer une régression linéaire entre le ELO ICCF et le CPB. Je me suis basé sur les classements d'avril 2001 publiés sur les sites des deux organisations. J'ai fait l'inventaire systématique des joueurs ayant un classement dans les deux organisations. J'en ai trouvé 131, ce qui est un nombre largement suffisant pour être représentatif. Le graphique ci-dessous, produit avec les fonctions intégrées d'un tableur, représente :
- le nuage des points où l'abscisse est le CPB et l'ordonnée est l'ELO ICCF,
- la droite de régression avec l'équation associée et le carré du coefficient de corrélation.

Le coefficient k voisin de 1,26 qui en ressort est proche du
calcul théorique précédent. L'alignement visuel du nuage avec la
droite de régression prouve la bonne confiance qu'on peut lui
accorder même si le coefficient de corrélation, qui n'est pas
extraordinaire, montre la non fiabilité d'une relation entre CPB et
ELO. L'erreur type entre le ELO ICCF et son estimation par la droite
de régression est de 90 points, ce qui veut dire que 32% des
estimations faites ainsi présentent une erreur supérieure à 90
points. Certains écarts dépassent même 300 points ! Encore heureux que la régression donne la meilleure formule de conversion, je n'ose pas faire le calcul avec la formule originale (k = 1,7).
1/ Le système Bridier n'est pas étalonné correctement par rapport au système ELO. Le coefficient k devrait être voisin de 1,2 suivant la théorie et en tous cas inférieur à 1,4, ce qui est confirmé par la valeur de 1,26 indiquée par l'analyse statistique.
2/ Le système Bridier n'est pas étalonnable par rapport au système ELO. En effet, la formule de conversion donnée par la régression est la meilleure possible et on a vu qu'elle n'est absolument pas correcte pour autant.
3/ Le système Bridier prétend s'affranchir des parties nulles, mais justement la connaissance de la proportion de celles-ci est nécessaire pour l'étalonner correctement en supposant que ce soit possible (taux de nulles voisin de 1 - k / 2 en étant inférieur), fait qui prouve son incohérence mathématique.
4/ Deux remarques dont je n'ai pas tenu compte, mais qui aggravent l'imprécision du système et le doute sur sa validité :
- La table des enjeux présentées dans l'article 6 montre ques les arrondis de calcul sont fait avant de terminer ledit calcul, facteur notable d'augmentation des erreurs. Un examen détaillé montre que la division par 2 de l'enjeu tous les 60 points est appliquée sur les extrémités des intervalles. Si on se fie au milieu des intervalles, ce qui est plus juste statistiquement, on trouve un pas de seulement 50 points!
- Dire que le professeur ELO lui-même aurait renoncé à ne pas tenir compte des parties nulles parce que des logarithmes sont plus difficiles à calculer que la loi de Laplace-Gauss est assez surprenant. D'ailleurs je prends une loi logarithmique connue qui approche presque à la perfection les tables ELO pour pouvoir mener mes calculs...
Il ne fait plus aucun doute que cette méthode de classement est absolument sans fondement mathématique, il serait sage de l'abandonner au plus vite.
Je viens juste de m'apercevoir d'un détail qui prouve encore plus rapidement qu'il est infondé d'un point de vue mathématique de vouloir établir un lien entre le ELO et le Bridier.
En effet, si on revient aux définitions de base on a :
- ELO : P / ( 1 - P ) = 10 ^ ( E / 400 )
- CPB : P / ( 1 - P ) = 10 ^ ( B / 200 )
Monsieur Bridier ne fait rien d'autre que prendre la même distribution
que le ELO, il change seulement l'échelle (200 au lieu de 400). Le
problème, c'est qu'il ne donne pas la même signification à P en
supprimant les nulles. Malheureusement, ceci a pour simple effet de
rendre les deux lois incompatibles entre elles.
|