Campeonato del Mundo de San Luis ¿Quién ganará?

28/09/2005 – Recientemente Garry Kasparov estimó en un 95% las opciones de que Anand, Topalov o Leko ganasen el título mundial. Nigel Short argumentó que seguramente los otros cinco contendientes tenían más del 5% de opciones y ofreció a Kasparov una apuesta 1 a 17. Ahora el estadístico Jeff Sonas nos ofrece unos precisos datos matemáticos. Datos, cifras y explicaciones en castellano

ChessBase 15 - Mega package ChessBase 15 - Mega package

Find the right combination! ChessBase 15 program + new Mega Database 2019 with 7.6 million games and more than 70,000 master analyses. Plus ChessBase Magazine (DVD + magazine) and CB Premium membership for 1 year!

Más información...

 

La visión de un estadístico sobre el Campeonato del Mundo FIDE

Por Jeff Sonas

El torneo por el Campeonato del Mundo FIDE, que tendrá lugar desde el 27 del septiembre hasta el 16 de octubre en San Luis (Argentina), debería resultar un acontecimiento fascinante. Es la primera vez en más de medio siglo que el campeonato mundial (masculino) de la FIDE se determinará en una liga, en vez de por medio de un encuentro o en un enorme torneo por eliminatorias. Acabo de finalizar una simulación detallada de los posibles resultados del torneo y han salido algunos números interesantes.

A estas alturas, es probable que hayan leído el artículo de Nigel Short en el que se cuestiona la reivindicación de Garry Kasparov's del 95% de posibilidades de que el torneo sea ganado por Viswanathan Anand, Veselin Topalov, o Peter Leko. Nigel se ofreció a apostar 100 $ sobre el ganador del torneo por los otros cinco jugadores (Peter Svidler, Alexander Morozevich, Michael Adams, Judit Polgar, and Rustam Kasimdzhanov) si Kasparov le pagase 17 a 1.

No hay duda de que es probable una victoria de Anand, Topalov, o Leko y, por supuesto, hay muchas consideraciones subjetivas difíciles de analizar numéricamente. Sin embargo, las estadísticas pintan un panorama más incierto que el sugerido por Kasparov. Según mis cálculos, los cinco jugadores restantes tienen unas posibilidades conjuntas del 41% (no del escaso 5%) para ganar el torneo, lo que hace parecer bastante atractiva esa apuesta de 17 a 1. Además, debido a que la fuerte tendencia de Leko hacia las tablas hace poco probable una puntuación positiva para él y pudiera necesitarse fácilmente una puntuación de +4 para ganar el torneo, a Peter Svidler se le dan en realidad unas opciones de victoria ligeramente mayores que a Leko (12% frente al 11%), y  Judit Polgar está ahí mismo, en ese grupo, con un 11% de posibilidades de ganar.

Viswanathan Anand parece ser el claro favorito, con un 31%. Veselin Topalov tien las previsiones mejores tras él con alrededor del 17% y cada uno de los seis restantes jugadores están entre el 8% y el 12%, excepto en lo que respecta al actual campeón del mundo FIDE Rustam Kasimdzhanov, que es el participante de lejos con más baja puntuación y al que sólo se le da una opción entre treinta para ganar el torneo. Seguiremos hablando más adelante de los jugadores pero primero quiero analizar el propio formato del torneo, porque es una antigua reclamación desde los campeonatos FIDE por eliminatorias de los últimos años. Podemos debatir sin fin sobre si es preferible un torneo o un encuentro, pero en vez de eso prefiero destacar que de todos los posibles formatos de torneo, éste es excelente.

Podría ser tentador el echar un vistazo a las reglas del torneo e inmediatamente empezar a criticar el hecho de que, como en el pasado, un primer puesto compartido pudiera ser decidido en último término por partidas rápidas, partidas relámpago o incluso con la partida "Armagedon" de muerte súbita. Por supuesto, nadie quiere que una partida rápida decida el campeonato, pero eso ciertamente es una posibilidad muy real en un torneo por KO, donde no a tantas opciones de desempate que no sea avanzar hacia partidas con control de tiempo más rápido. No se pueden utilizar los resultados individuales o el número de victorias porque siempre son los mismos para ambos jugadores. Y la "primera victoria" (o la "última victoria") se considera demasiado injusta para el jugador que empezó con negras (o que terminó con ellas). El campeonato FIDE de hecho se determinó con partidas rápidas dos veces durante la era del KO: en la primera competición cuando Anatoly Karpov derrotó a Anand en 1998 y luego en la última, cuando Kasimdzhanov venció a Michael Adams en 2004.

Sin embargo esta preocupación es mucho menos relevante en San Luis que lo que lo fue en los torneos por KO. En una competición por el sistema de liga, y especialmente en una larga, es posible establecer reglas de desempate de forma que sea casi seguro resolver el primer puesto por medio de las propias partidas clásicas. Durante un torneo largo habrá muchas diferencias en la cantidad de victorias de cada jugador y también pueden usarse varios resultados individuales. Sin duda, algunos de los criterios de desempate pueden parecer algo arbitrarios (p. e., ¿por qué no “menos derrotas” en vez de “más victorias”?) Sin embargo, al menos de esta forma los jugadores saben con anticipación en lo que se están metiendo y pueden jugar de acuerdo con ello a medida que se aproximan las rondas finales y las situaciones de desempate van cristalizando. Por supuesto, siempre se puede jugar la partida “¿Y qué?” y regresar a criticar el desempate final (partidas con control de tiempo más rápido), pero para esta competición en concreto y con estas reglas en particular, es poco probable que el campeonato tenga que resolverse con partidas rápidas o relámpago. En concreto, las opciones son de 38 a 1 contra la necesidad de resolver el campeonato con partidas rápidas.

Repasemos las diversas posibilidades. En primer lugar, recuerden que es una competición muy larga, catorce rondas. Eso significa que es bastante probable que los jugadores se ordenen bastante por si mismos; de hecho, según mis cálculos, hay casi un 80% de posibilidades de que haya un ganador claro tras 14 rondas, lo que significa que toda esta preocupación por los desempates resultaría bastante irrelevante. En otras palabras, si jugásemos este torneo 40 veces, tendríamos un ganador claro en el primer puesto en 32 ocasiones y veríamos un primer puesto compartido sólo en 8. ¿Qué pasa en esos 8 casos restantes?

Según las reglas, el primer criterio de desempate es el de los resultados individuales entre los jugadores empatados. Por ejemplo, si hubiera un empate entre tres, miraríamos los resultados individuales sólo entre esos tres jugadores. Si continúa el empate, se va al siguiente criterio, que es contar el número total de partidas ganadas durante todo el torneo por cada jugador (contra todos los rivales, incluso aquellos que no comparten el primer puesto). La mayor parte de las veces el criterio bastará para determinar un ganador único. Sólo en una ocasión de cada 40 hay que recurrir a partidas rápidas. E incluso si hay que ir a ellas, hay casi un 98% de opciones de que se vean implicados dos jugadores, en vez de la extraña mini liga con varios jugadores que prevén las reglas.

En este tema de las partidas rápidas, quiero señalar otra cosa. Sé que la victoria de Rustam Kasimdzhanov del año pasado en Trípoli fue una gran sorpresa, pero en realidad podía haber sido anticipada de alguna manera por medio de la estadística, si se hubieran usado en los cálculos las puntuaciones de rápidas. No las empleé porque no había a mano una lista oficial de rápidas de la FIDE. Pero en retrospectiva quiero llamar la atención a Stefan Fischl, que mantiene una web en la que se incluye una clasificación no oficial de partidas rápidas, que se remonta unos pocos años atrás. Según la lista de Stefan, al comienzo del torneo de Trípoli 2004, Kasimdzhanov estaba en el puesto 2 en ajedrez rápido entre los 124 participantes, justo por detrás de Veselin Topalov. Así que quizás no es tan sorprendente que Kasimdzhanov fuera capaz de eliminar a Alejandro Ramírez, Vassily Ivanchuk, Topalov, y por último Adams mediante partidas rápidas. Y ahora, Kasimdzhanov está segundo del mundo en la clasificación no oficial de rápidas de jugadores activos (por detrás sólo de Viswanathan Anand y Garry Kasparov)

Así que si llegamos a un desempate a rápidas, puede que les interese conocer que la puntuación no oficial de Anand en esa modalidad es más de 60 puntos superior a la de cualquier otro en San Luis, pero los lugares 2º  y 3º (entre los participantes en San Luis) los ostentan los que tienen menos posibilidades Kasimdzhanov y Alexander Morozevich, con Judit Polgar muy abajo en la clasificación de rápidas, a más de 200 puntos por detrás de Anand. Empleé esas puntuaciones de rápidas en mi modelo de simulación, pero realmente no es muy significativo porque es poco probable un desempate a rápidas.

Basta de desempates; volvamos a las rondas 1 a 14, la parte clásica del torneo, que (como he dicho) tiene el 97% de posibilidades de bastar para determinar el siguiente campeón FIDE. ¿Quién es el favorito para ganar y por qué?

Mi modelo de simulación tomo diversos factores en consideración. El factor más importante, por supuesto, es la fuerza estimada de cada jugador: su puntuación. En vez de usar directamente las puntuaciones FIDE, he escogido emplear mi fórmula más exacta de puntuación Chessmetrics para calcular la fuerza de cada jugador al 1 de septiembre. También consideré otros factores, como la fuerza con blancas y negras de cada jugador, así como sus frecuencias de tablas con cada color. También busqué resultados individuales significativos en el pasado y, finalmente (tras muchos titubeos) decidí incluir una bonificación/penalización para los jugadores que lo han hecho particularmente bien/mal contra una oposición 2700+. Tomando en consideración todos estos factores y simulando el torneo completo un millón de veces, esto es lo que salió:

Indudablemente hay algunas diferencias importantes entre estas cifras y las que se esperarían a partir de la clasificación FIDE. Primero y más importante, Anand y Topalov están empatados en la última lista FIDE, con Peter Leko a 25 puntos por detrás, y hay otro salto de 25-30 puntos antes de alcanzar a Peter Svidler y Judit Polgar. Entonces ¿por qué tengo a Anand tan por delante de Topalov y como hicieron Svidler y Polgar para alcanzar a Leko?

Bueno, es un poco difícil de explicar, pero haré un intento. Puede que recuerden un artículo que escribí hace un par de años donde sugería reemplazar la actual fórmula Elo con una fórmula “lineal” más simple. Mis análisis mostraban que la fórmula Elo crea un involuntario margen de error contra los jugadores que tienden a vencer a oponentes 100 o 200 puntos por debajo. Por ejemplo, si tiene una ventaja de 150 puntos sobre su oponente, los datos empíricos dicen que puntuará un 67%, mientras que la fórmula Elo espera que puntúe el 70%. Así que si juega 100 partidas contra rivales que estén 150 puntos por debajo y pongamos que puntúa realmente 67/100 (encajando exactamente en las predicciones empíricas), entonces la fórmula Elo reclamaría que debería haber puntuado 70/100, y de ese modo hubiera puntuado 3 puntos completos por debajo de sus expectativas y perdería (sin merecerlo) 30 puntos.

Entre los participantes en este torneo, los jugadores distintos de Kasimdzhanov que típicamente se enfrentan a jugadores con menos nivel (debido a las competiciones en las que tienden a participar) son Peter Svidler y Alexander Morozevich. Estos dos jugadores han tenido una ventaja promedio de puntuación de unos 100 puntos en las partidas de los últimos años y por eso sus puntuaciones FIDE son algo más bajas de las que realmente merecían, debido a la desviación mencionada más arriba. En el otro extremo del espectro, Peter Leko y Veselin Topalov se enfrentan a rivales tan fuertes que sólo los superan por 25 o 30 puntos. Leko y Topalov no tienen ese desfase del Elo en su contra, así que sus puntaciones FIDE son un poco mayores de las que merecen, en relación con los demás. Así que lo que parece un salto de 25 puntos en la fuerza entre Leko y Svidler en la clasificación FIDE se revela como simplemente una función de la clase de competiciones en las que participan y de hecho Leko y tienen probablemente una fuerza parecida, a pesar de lo que dice la clasificación. Y mientras que Anand se enfrenta a oponentes del mismo calibre que los de Topalov, la puntuación de Anand es tan alta que también sobrepasa en 100 puntos a su oponente típico. Por ello, la fórmula Elo da unas expectativas irrazonables a Anand y su puntuación FIDE es también menor que la que merece.

Hasta aquí la explicación simplificada. Hay mucho más, porque las fórmulas de puntuación son en realidad muy distintas. Por ejemplo, las puntuaciones FIDE no tienen en cuenta que Judit Polgar se pasó un año completo en blanco, mientras que mis puntuaciones (que tienen en cuenta la inactividad) son sensibles al paso del tiempo. Topalov juega con mucha más frecuencia que lo que lo hacía hace algunos años y eso también está afectando a su puntuación. ¡Si algo hay que destacar es lo sorprendente que resulta que la lista FIDE y la de Chessmetrics sean tan parecidas! Sin embargo ustedes no estén muy preocupados por los entresijos de los cálculos de la puntuación, así que dejémoslo así: he optimizado mi fórmula para darle el máximo poder de predicción y dice que Svidler en realidad es tan fuerte como Leko, y que Anand es algo más fuerte que Topalov, pero ¿quién sabe la verdad?

Ya que estamos haciendo este viaje nostálgico por mis pasados esfuerzos periodísticos, déjenme recordarles otro artículo que escribí hace algunos años, tratando de ver si los resultados individuales del pasado tenían alguna proyección sobre los resultados futuros. Sé que los jugadores piensan que es así, que hay ciertos jugadores contra los que les encanta jugar y otros con quienes odian hacerlo. En aquel artículo concluía que realmente no había tal efecto, que no importaba si se habían obtenido resultados buenos o malos en el pasado contra alguien.

Sin embargo, dado que los enfrentamientos individuales son tan relevantes en este torneo (son el primer criterio de desempate), pensé que debería revisar aquella investigación un poco. Así que volví a ejecutar los análisis usando las nuevas puntuaciones Chessmetrics y comprobé si teniendo en cuenta los enfrentamientos individuales del pasado se mejoraban las predicciones de enfrentamientos futuros. Resulta que si se sobrepasa un cierto nivel de relevancia, mejora las predicciones futuras si se corrigen enfrentamientos en los que un jugador parece tener una especial “habilidad” para vencer a otro.

El ejemplo histórico más famoso es (por supuesto) la carrera de Vladimir Kramnik de dominio sobre Garry Kasparov. A lo largo de su carrera, Kramnik le llevó unos 79 puntos a Kasparov (lo que significa que Kramnik logró 7,9 puntos completos más de los esperados, en todas sus partidas). Es de lejos la mayor cantidad en la historia del ajedrez. Si volviesen a jugar, esta metodología recompensaría a Kramnik con una bonificación especial de 26 puntos cuando se enfrentase a Kasparov. Empatados en segundo lugar con 60 puntos está la dominación de Viktor Korchnoi sobre Lev Polugaevsky y la de Kramnik sobre Judit Polgar (que podría llegar a ser especialmente relevante si Polgar se las arregla para ganar este torneo; ¡Kramnik recibiría una bonificación especial de 20 puntos contra Polgar!) Más abajo en el puesto 33 de  la clasificación histórica está el rendimiento superior de Leko frente a Topalov y hay que bajar hasta el puesto 102 en la lista para encontrar el mejor rendimiento de Anand contra Polgar. Aquellos dos emparejamientos de San Luis son los únicos que se pueden calificar como “significativos”. Por eso en mi modelo le doy a Leko una ventaja adicional de 14 puntos cuando se enfrenta con Topalov y le doy a Anand un extra de 11 puntos contra Polgar. Pero con todo, creo que este factor no es especialmente relevante.

También decidí comprobar si ciertos jugadores lo hacían especialmente bien (o especialmente mal) cuando se enfrentan a rivales de elite. Puse la frontera en el nivel 2700 y, para cada jugador, examiné sus resultados históricos con jugadores de 2700+ y contra jugadores por debajo, para ver si había alguna diferencia inusual en los resultados. De los ocho participantes, los tres que lo han hecho especialmente bien frente a rivales 2700+ fueron Peter Svidler, Peter Leko y Rustam Kasimdzhanov, y les di una bonificación de 7 puntos en mis cálculos (puesto que éste es uno de esos acontecimientos de elite). Por otra parte, Alexander Morozevich históricamente lo ha hecho mucho mejor contra jugadores por debajo y no tan bien frente a oponentes del nivel 2700, así que tiene una penalización de 11 puntos en mi cálculo. Veselin Topalov y Judit Polgar también recibieron penalizaciones más pequeñas de este tipo. Aquí tienen un sumario de los diferentes modificadores que usé:

Jugador

FIDE

CM

2700+

Final

Tablas

Opciones

Anand

2788

2794

2794

50%

31%

Topalov

2788

2767

-7

2760

43%

17%

Svidler

2738

2742

+7

2749

49%

12%

Leko

2763

2744

+7

2751

57%

11%

Polgar

2735

2741

-6

2735

41%

11%

Morozevich

2707

2727

-11

2716

37%

8%

Adams

2719

2723

+4

2727

53%

7%

Kasimdzhanov

2670

2671

+7

2678

38%

3%

En esta lista quiero llamar su atención sobre la columna del porcentaje de tablas. En conjunto espero un porcentaje de tablas del 46%. Aunque se trata de una competición de elite y por ello tradicionalmente repleta de tablas, la inclusión de Topalov, Polgar, Morozevich y Kasimdzhanov debería asegurar muchas partidas decididas y esto podría tener un resultado muy interesante. Recuerden que el número total de victorias logradas por un jugador es uno de los criterios de desempate, y por ello los jugadores que ganan mucho y pierden poco tendrán una ventaja sustancial sobre otros que ganan poco pero nunca pierden.  Hay otro factor matemático involucrado, que es que los jugadores que arriesgan tienen más opciones de encadenar victorias y lograr una puntuación realmente alta que les permita ganar el torneo.

Para ilustrar esto, comparemos a Judit Polgar con Peter Leko. En la lista anterior pueden ver que una vez considerados todos los factores, a Leko se le da una “puntuación final San Luis” por encima de 2750 mientras que la de Polgar baja a 2735. Sin ambargo, se les da un idéntico 11% de opciones para ganar el torneo. ¿Por qué? De nuevo, es un poco difícil de explicar, pero lo intentaré. Si ha llegado hasta aquí, al menos debe estar ligeramente interesado. Los jugadores con muchas partidas decididas tienen una “campana” más amplia de puntuaciones totales, lo que significa que tienen opciones bastante significativas de lograr una puntuación positiva grande, junto con una probabilidad bastante significativa de una puntuación negativa grande. En el otro lado, los jugadores propensos a las tablas, no tienen una variación tan amplia en los resultados posibles:

Pueden ver que la curva de Leko tiene un máximo en una puntuación igualada o +1, así que es tiene más probabilidades que Polgar de finalizar con tal resultado. Ella tiene claramente más probabilidades que Leko de lograr una puntaución grande negativa como -4 or -5, pero a pesar de su menor puntuación, una vez que se sitúa en el rango +4 o +5, la impredecible Polgar realmente tiene más opciones que el propenso a las tablas Leko para terminar con ese resultado amplio. Y dado que es probable que haya que lograr un resultado de +3 (o superior) para ganar el torneo, las opciones de Polgar de ganar el torneo son bastante comparables a las de Leko. Sus resultados medios son menores, pero eso no importa tanto como su probabilidad de obtener un resultado final amplio. Lo mismo cabe decir sobre porqué Svidler realmente tiene unas opciones de victoria ligeramente mejores que el mejor clasificado Leko y porqué Morozevich tiene unas opciones de victoria ligeramente mejores que el mejor clasificado Adams.

Por último, me gustaría dar alguna justificación de lo que he dicho en el último párrafo sobre la necesidad de un marcador +3 o +4 para ganar el torneo. Recuerden que he simulado este torneo un millón de veces distintas. En unos casos un resultado de +2 fue suficientemente bueno para lograr el primer puesto con claridad y en otros un resultado de +9 ni siquiera fue bastante para empatar en el primer puesto. Incluso hubo un torneo simulado en el que los ocho jugadores empataron con 7/14 y los criterios clásicos de desempate bastaron para determinar dos jugadores para el desempate a rápidas, ¡donde Svidler venció a Kasimdzhanov y ganó el título! Sin embargo, tomando un promedio agregado, se puede tener una percepción buena de las tendencias generales en las que se logrará la victoria.

Puedo decirles que más del 70% de las veces, el torneo lo ganó alguien puntuando +3, +4, o +5, siendo +4 el resultado con más probabilidades de ganar. Un resultado de +2 es probable que no vaya a ser suficiente para ganar el torneo; de hecho, las opciones están 17 a 1 contra convertirse en campeón si se termina con +2. Lograr un resultado de +3 es obviamente más prometedor, pero las opciones aún están 2 a 1 en contra. Por otro lado, un resultado de +4 probablemente da un 51% de opciones de terminar primero con claridad y un 11% adicional de compartir el primer puesto y aún así ganar el título, lo que en total significa un 62% de oportunidades si se logra +4. Aquí tienen un gráfico que ilustra las cifras para todos los marcadores entre +1 y +10.

Parte de la diversión de esto es ver como cambian las cifras a medida que transcurre el torneo y tratar de imaginar el porqué. A menudo hay algo muy significativo que ha sucedido y de lo que nuna me hubiera dado cuenta sin escavar un poco más. Mi plan es facilitar actualizaciones estadísticas en cada día de descanso del torneo y tratar de explicar porque las cifras han cambiado. Espero que se hayan divertido con este artículo. Sé que la perspectiva estadística no es la única y ni siquiera la más importante. Pero quizás facilitará un contrapunto útil para aproximaciones más subjetivas. En cualquier caso, les veré de nuevo el primer día de descanso. Mientras tanto, pueden visitarme cuando quieran en mi sitio Chessmetrics o enviarme mensajes de correo electrónico sobre cualquiera de estos temas.



Discussion and Feedback Join the public discussion or submit your feedback to the editors


Comentar

Normas sobre los comentarios

 
 

¿Aún no eres usuario? Registro