Para zanjar el debate sobre el factor K

16/05/2009 – La discusión sobre el factor K (la tasa a la que las puntuaciones suben o bajan cuando se calculan) alcanza su punto culminante con un artículo del Dr. John Nunn, gran maestro y matemático, que valora los argumentos presentados por las distintas partes. Después de esto depende de la FIDE, que ya ha dado pasos positivos para tomar una decisión sobre el tema. Habrá una reunión en junio para decidir el rumbo que tomará la K. Naturalmente se les informará de cualquier novedad que surja en este área, pero mientras tanto les hemos traducido al castellano esta última entrega...

ChessBase 14 Download ChessBase 14  Download

Programa de gestión de bases de datos de ajedrez que es referencia mundial. Todos usan ChessBase, desde el campeón del mundo al aficionado. Inicie su historia de éxito personal con ChessBase.

Más información...

Para zanjar el debate sobre el factor K

GM Dr. John Nunn (Inglaterra)

Mi pequeño trabajo sobre el aumento del factor K en el sistema Elo ha provocado varias respuestas, que he leído cuidadosamente. Alguno de los corresponsales apuntaron cosa interesantes y valiosas y me gustaría responder, más detalladamente que en mi mensaje original, que pretendía ser breve y conciso.

Leí el artículo de Jeff Sonas aparecido en 2002 en ChessBase. En este artículo Sonas analiza los resultados de su sistema de puntuación y aporta pruebas de que predice mejor los resultados futuros que el sistema Elo. Puede que sea cierto que su sistema sea mejor a ese respecto que el sistema Elo; es una cuestión compleja. Sin embargo, es importante darse cuenta de que el sistema Sonas es fundamentalmente distinto del sistema Elo ( por ejemplo, se basa en una función lineal, en vez de en una distribución de probabilidad normal) Lo que la FIDE va a hacer no es adoptar íntegramente el sistema Sonas, sino simplemente aumentar el factor K en su sistema actual. Por lo tanto, los posibles méritos del sistema Sonas no son relevantes en el debate actual. Me atengo a mi punto de partida original de que no hay prueba de que el incremento de K a 20 mejore el sistema actual.

Varios corresponsales apuntaron que la frecuencia de las listas Elo afectan a la puntuación y que, por lo tanto, mi comentario original en sentido contrario era inexacto. Por ejemplo, supongamos que X es un joven jugador con un Elo publicado de 2400. X ha mejorado rápidamente durante los meses pasados y ahora tiene una fuerza de 2500. Para simplificar asumamos que X logra un rendimiento de 2500 en cada torneo que juega ahora. Entonces, cada torneo implica un aumento de Elo. Esos aumentos de puntuación están como si fuera ‘en el banco’, pero no tienen efecto en la puntuación de X hasta que se publique la siguiente lista. Si esa publicación se difiere en el futuro (en una época las listas Elo solo aparecían una vez al año, por ejemplo) la puntuación de X dará un gran salto cuando se publique la lista siguiente y puede que incluso esté por encima de 2500; en otras palabras, su puntuación publicada puede ser superior a sus rendimientos. Si las clasificaciones se publican con más frecuencia, digamos mensualmente, entonces el Elo de X aumentará hasta digamos 2415 tras un mes. Debido a que su puntuación es ahora mayor, la próxima vez que juegue a nivel de 2500, su aumento de puntuación será menor y su puntuación finalmente convergirá hacia 2500.

Llamaré a este fenómeno ‘retardo de puntuación’ porque se debe al retardo entre que se juega una partida y se ve el efecto en la puntuación Elo publicada. Cuanto más largo es el intervalo entre listas de puntuación, más grande es el efecto del retardo de puntuación. Cuando las listas se publicaban solo una vez al año, su influencia era obvia. El retardo de la puntuación es indeseable porque distorsiona la puntuación. Los jugadores que mejoran rápidamente reciben puntuaciones más altas que las que recibirían si se calculasen de forma continua, mientras que los jugadores en rápido declive terminan con puntuaciones inferiores. Como se apuntó más arriba, en casos extremos puede conducir a importantes anomalías, como que un jugador tenga una puntuación más alta que su rendimiento. Sin embargo, esos casos extremos eran poco probables incluso con las listas anuales y con las actuales listas trimestrales son virtualmente imposibles. El retardo de puntuación en el actual sistema trimestral afecta solo a un pequeño número de puntuaciones y solo ligeramente. Por supuesto, es posible construir ejemplos artificiales (como hicieron algunos corresponsales) pero con datos del mundo real los efectos del retardo de la puntuación son casi siempre muy pequeños (Volveré a este punto posteriormente)

Vale la pena destacar que el retardo de la puntuación no es parte inherente del sistema Elo; surge de la forma en que se administra. Hace décadas, los resultados de los torneos tenían que enviarse por correo postal y los cálculos se hacían a mano, así que no era factible actualizar la lista con más frecuencia que una vez al año. Ahora que los resultados se envían por Internet y todos los cálculos se hacen por ordenador, es tanto posible como deseable editar las listas con mucha más frecuencia y eso es lo que ha hecho la FIDE. El cambio a listas mensuales tendrá el efecto deseable de reducir más el retardo de la puntuación, así como dar a los jugadores información más actualizada.

El retardo en la puntuación es un fenómeno que básicamente está en función de la frecuencia de las listas de puntuación y no está conectado directamente con el factor K, aunque un factor K más alto lo pone más de manifiesto. El argumento del GM Bartlomiej Macieja es que quiere aumentar el factor K para tener la misma cantidad de retardo en la puntuación con las listas mensuales que el que había previamente con las listas trimestrales. Eso significa perder el objetivo. El retardo de la puntuación es un defecto que debería eliminarte tanto como sea posible y no aumentarse. También, su ejemplo sobre dos jugadores con elos de 2500 y 2600 que luego tienen los mismos resultados falla por su base. Con un factor K muy bajo (digamos K=1) la diferencia entre los jugadores permanecerá grande durante mucho tiempo. Pero con un factor K muy alto (digamos K=100) es muy probable que el jugador de 2600 terminará con una puntuación publicada inferior que la del jugador de 2500, lo cual es incluso más anómalo. Dependiendo de los detalles de los resultados, habrá un factor K que haga que las dos puntuaciones sean las mismas después de un cierto periodo de tiempo, pero ese llamado factor K ‘óptimo’ depende completamente de los números precisos que se escojan y al repetir el razonamiento con diferentes condiciones iniciales y resultados se puede concluir con un factor K ‘óptimo’ del valor que se quiera.

Eso es así porque el retardo en la puntuación y el factor K no están directamente relacionados. Un factor K más alto ampliará el retardo de la puntuación, ya que aumenta todos los cambios de puntuación, pero de los dos cambios (aumentar el factor K y tener listas Elo más frecuentes) el aumento del factor K tiene un efecto mucho más profundo. La razón es que a medida que las listas se publican con más frecuencia, la puntuación tiende a converger con la que se obtendría con un sistema de puntuación 'continuo', es decir, uno que se actualizase cada vez que se jugase una partida. Esa convergencia implica que aumentar la frecuencia de las listas cada vez tiene un efecto más pequeño cuantas más listas hay. Aumentar el factor K, sin embargo, tiene un efecto lineal; doblar el factor K, dobla el el cambio de puntuación; triplicar el factor K triplica el cambio de puntuación.

Probablemente sea preciso un ejemplo. Escogí un jugador aleatoriamente de la lista FIDE (en realidad la examiné alfabéticamente hasta que encontré un jugador con Elo 2500+ que hubiera jugado bastante activamente durante  2008). La persona que escogí fue Farid Abbasov. Entonces saqué un listado de todas las partidas que jugó en 2008 y, comenzando el 1 de enero de 2008, calculé cómo hubiera cambiado su puntuación el 1 de enero de 2009 con diferentes valores de K y distintas frecuencias de elaboración de las listas de puntuación. Merece la pena destacar que este jugador debería mostrar más efecto de retardo de la puntuación que la mayoría, ya que jugó tantas como 80 partidas en 2008 y también mostró una mejora significativa en este periodo; esas son precisamente las circunstancias en las que el retardo de la puntuación se esperaría que fuese más significativo.

Aquí está el resultado:

Puntuación el 1 de enero de 2009

  K=10 K=20 K=28
Lista anual 2576 2646 2701
Listas semestrales 2559 2588 2598
Listas trimestrales 2557 2581 2585
Listas mensuales 2554 2572 2577


[Gráfico de la redacción de ChessBase]

La tabla muestra algunos efectos ya mencionados; cuanto más a menudo se actualiza la lista, menos aumenta la puntuación de Abbasov, pero este efecto es bastante pequeño; en realidad, se puede ver que con K=10 la puntuación no cambia mucho una vez que las listas se elaboran al menos dos veces por año. Sin embargo, el cambio que resulta de aumentar K=10 hasta K=20 es mucho más sustancial que cualquier efecto que resulte de alterar la frecuencia de las listas. Y recuerden que este jugador ha sido escogido para destacar los efectos del retardo de la puntuación. Los lectores pueden observar que la puntuación 2557 difiere de la publicada por la FIDE para  Abbasov en la lista de enero de 2009, que fue 2565. Eso es debido a que la FIDE incluyó un torneo jugado en diciembre de 2007 en sus cálculos para 2008, mientras que yo me atuve a las fechas reales en las que se jugaron las partidas, de forma que ese torneo fue excluido (Hay otro par de efectos menores debidos a las fechas límite de la FIDE para calcular las listas)

Por supuesto, esto es solo para un jugador. Sería interesante que alguien con más habilidades informáticas que las que yo tengo ampliase esto a un rango más amplio de jugadores, aunque no espero que los resultados difieran mucho.

En resumen, me atengo a mis dos planteamientos básicos: no está demostrado que el aumento del factor K mejore el sistema de puntuación y no hay auténtica conexión entre el factor K y la frecuencia de las listas de puntuación. Ambos tienen efecto en las puntuaciones, pero esos efectos son en buena parte independientes.

Consideraba que el aspecto más significativo de mi ensayo original era el referido a las trampas con la puntuación, pero para mi sorpresa pocos corresponsales se refirieron a ello. En los últimos años se ha visto ya un lamentable aumento de los casos de falta de honradez en el ajedrez y mi preocupación es que con la cada vez mayor importancia de las puntuaciones, hacer más fáciles las trampas con la puntuación solo va a animar a más gente a hacerlas. Para los jugadores profesionales, la puntuación es quizás el factor más influyente en su carrera y su medio de vida y el bienestar de sus familias depende de ella. La FIDE fue muy lenta a la hora de responder a la posibilidad de que se hiciese trampas con ayudas electrónicas; en realidad, puede decirse que en realidad aún no han comprendido completamente este tema. Espero que considerarán cuidadosamente la implicación del cambio a K=20 y no aumentarán los problemas que ya existen en el mundo del ajedrez.

El Dr. John Nunn (nacido el 25 de abril de 1955) es uno de los ajedrecistas y autores más conocidos del mundo. Mostró tempranamente su prometedor futuro ganando el campeonato británico sub-14 a los 12 años y consiguiendo otros varios títulos juveniles antes de ganar el Campeonato de Europa Juvenil en 1974-5. Al mismo tiempo estudiaba matemáticas en Oxford, tras entrar en la universidad a la inusualmente temprana edad de 15 años. En 1978 logró un doble éxito al obtener tanto su doctorado (con una tesis sobre topología algebraica) y el título de GM (tras ganar un torneo en Budapest) En 1981 abandonó la vida académica por su carrera como ajedrecista profesional. En 1984 ganó tres medallas de oro individuales en la Olimpiada de Tesalónica, dos por su rendimiento 10/11 en el tablero dos de Inglaterra y otra por ganar la competición de resolución de problemas que se disputó en un día de descanso.

La mejor etapa de John delante del tablero fue 1988-91. En 1989 estuvo clasificado entre los diez mejores del mundo y ese mismo año terminó sexto en la serie de la Copa del Mundo de la GMA, en la que virtualmente participaron todos los mejores jugadores del mundo. También ganó el torneo de Wijk aan Zee en 1990 y 1991, a añadir a un empate anterior en el primer puesto en 1982.

John Nunn también fue un autor de libros de ajedrez muy activo a finales de los 1980s y en los 1990s, dos veces ganador del prestigioso premio al libro del año otorgado por la Federación Británica de Ajedrez. Cuando su carrera ajedrecística comenzó a recurvarse hacia abajo en los 1990s, dedicó más energía a la edición de libros de ajedrez y en 1997, insatisfecho con los editores ajedrecísticos existentes, junto con Murray Chandler y Graham Burgess fundó Gambit Publications, que ahora tiene más de 200 libros impresos. Cuando en 2003 se retiró de práctica activa, volvió a resucitar su temprano interés en los problemas de ajedrez y en 2004 ganó el Campeonato del Mundo de Resolución de Problemas de Ajedrez, añadiendo a la vez el título de GM de resolución de problemas a su anterior título como ajedrecista sobre el tablero. En 2005 y 2006 formó parte del equipo británico que ganó el Campeonato por Equipos de Resolución de Problemas. En 2007 repitió su anterior éxito al ganar el Campeonato del Mundo de Resolución de Problemas de Ajedrez por segunda vez.

En 1995 se casó con la ajedrecista alemana Petra Fink. Tienen un hijo, Michael, que actualmente tiene 10 años.

Esta es, por el momento, nuestra última publicación sobre el tema. El estadístico Jeff Sonas realizará algunos experimentos prácticos con los datos de puntuación FIDE del pasado y la propia FIDE está explorando las opciones disponibles en el momento actual. Habrá una reunión en junio para decidir el rumbo que se tomará. Naturalmente se les informará de cualquier novedad que surja en este área. Hasta entonces por favor acepten que hemos ilustrado todas las facetas del debate adecuadamente y no publicaremos opiniones o respuestas a ninguno de los autores hasta entonces.

Referencias


Temas: FIDE
Discussion and Feedback Join the public discussion or submit your feedback to the editors


Comentar

Normas sobre los comentarios

 
 

¿Aún no eres usuario? Registro