Е-Рейтинг
Дoмoй Библиотека Линарес 2004 Аэрофлот 2004 W an Z  03 Новгород 97 AO - 03 Elo 01.03.04 2003 2002 Russia 03 EuroPr 03 EuroCl 03 EuroT 03 Pers EuroT 03 Team Elo 02 03 Е-Rating 1934-36 гг 1935-36 гг

Сухую статистику надо НЕ мочить, ее надо РАЗМАЧИВАТЬ, можно с пивом ...

26.03.2004

Олимпиады
Радио СПОРТ
Теннис
Хоккей

ФОТОАЛЬБОМ

Гостевая

Форум

Голосования

Е-Рейтинг – решение проблемы или …

Евгений Потемкин Радио СПОРТ 271314@mail.ru

Вот уж действительно все относительно В. Высоцкий

Очко за победу, половинка за ничью, баранка при поражении. Это основа всей шахматной жизни. Это настолько естественно и привычно, что кажется абсолютной истиной. Правда, футболисты что-то пытаются изменить и за победу теперь дают 3 очка. Но это от безысходности. У них и рейтинг какой-то свой особенный – с массой коэффициентов, поправок и волевых решений. Про рейтинг у теннисистов тоже ничего хорошего с точки зрения статистической теории. В шахматах несколько десятилетий царит система профессора Эло – обоснованная статистической теорией и подтвержденная миллионной статистикой  результатов партий: от высочайшего, до любительского уровня. Но и Эло также стоит на очковой системе.

Проблема Эло

Для того, чтобы скорректировать использование абсолютных очков при оценке относительных результатов, какими являются результаты партий Эло использует начальные рейтинги. Для оценки силы шахматиста в течении продолжительного периода это приводит к вполне удовлетворительным результатам. Система Эло просто «забывает» первоначальный рейтинг и по прошествии определенного числа партий рейтинги Эло приходят в равновесие с результатами. Проблем у системы естественно возникают при "слишком быстром" изменении мастерства шахматистов. Эта ситуация "исправляется" введением дополнительного эмпирического коэффициента. И в силу своей статистической природы систему Эло, строго говоря, невозможно применить для оценок достижений шахматистов в одном турнире или за определенный период.

В системе Эло вводится начальный рейтинг. Для оценки силы этот прием оправдан, поскольку, рейтинг Эло постепенно «забывает» прошлые результаты. А как быть в оценке результатов турнира? Если установить всем одинаковый рейтинг, то возникает проблема «расписания» - тот, кто встречается с более слабыми соперниками на старте имеет преимущество. Введение же перед турниром разных стартовых рейтингов – вообще не приемлемо.

На старте все равны?

Исторически, «принцип спортивной справедливости» - равенство условий для всех участников соревнования. В спорт относительных достижений этот принцип был просто перенесен из спорта абсолютных достижений. На старте любого шахматного турнира все участники имею равное количество очков – 0. Это строго соответствует очковой системе.

Решение проблемы видится в том, чтобы считать участников на старте не «равными» а «равно неизвестными». То есть результат турнира должен определяться только результатами партий. Без использования предположения о равенстве участников на старте как это необходимо делать при очковой системе или рейтинге Эло

Очки

И все же давайте посмотрим внимательно на очковую систему. Очки это способ представить результат в виде некоторой абсолютной величины. Такой же как, например время на дистанции у легкоатлетов или вес штанги у штангистов. Однако если в тех видах мы имеем некий измерительный прибор (секундомер, весы) для определения результата, то в нашем случае «измерительным прибором» являются сами участники. Представьте себе ситуацию, когда для каждого легкоатлета используется свой секундомер, и его настраивают соперники. Мягко говоря результаты такого состязания будут приближенными. Но так же приближенно и начисление одинаковых очков за победу над разными соперниками.

Итак, очки это перовое, или точнее сказать нулевое приближение оценки результата. Понимание этого возникло давно. Следующий шаг в уточнении результата участников турниров – это известные коэффициенты Бухгольца и Бергера, подсчитывающие количество набранных очков либо у всех соперников, либо у тех над кем одержана победа. Однако эти коэффициенты используются как дополнительные показатели лишь при равенстве очков. Лишние пол очка перевешивают любое «качество» набранных очков. Даже если участник одержал победы над всеми лидерами, но имеет на пол очка меньше соперника он в итоге будет стоять ниже.

Такое положение справедливо лишь для того кто придерживается классического, «ньютоновского» взгляда на мир вообще и на шахматные турниры в частности. Однако природа окружающего нас мира релятивистская. И результаты шахматных партий тоже. Поэтому представляется разумным сделать следующий шаг в проблеме оценки результата. Возможно, это позволит решить хотя бы некоторые проблемы.

Е-Рейтинг.

Рейтинг вообще по определению величина относительная. В случае противоборства двух участников естественно принять определение рейтингов участников как отношение числа их побед и поражений. (Для простоты изложения ничьи просто опускаются. В дальнейшем ничья рассматривается как половинки побед и поражений)

Rij / Rji = Wij/Wji = Wij/Lij = Lji/Wji = Lji/Lij

Отметим, что абсолютная величина парных рейтингов не определена и не имеет значения. Совершенно одинаковый смысл имеют соотношения рейтингов 2 к 1, 10 к 5 или 300 к 150.

В любом турнире (нескольких турнирах) мы имеем матрицу парных рейтингов для всех пар участников. При этом часть клеток может быть пустой. Нам необходимо свести такую матрицу к набору чисел (рейтингов) однозначно характеризующих достижения каждого участника. Так, чтобы можно было расположить участников в соответствии с их достижениями.

В очковой системе ранжирование обеспечивается суммированием набранных очков, приравнивая все победы, ничьи и поражения.

Мы определим, что рейтинг участника в турнире (турнирах) равен среднему от всех парных рейтингов данного участника

Ri = Sum Rij * Nij / Ni

Это определение ни сколько не менее обосновано, чем сумма очков в очковой системе.

Мы еще не определили абсолютную величину парных рейтингов. Что же будем суммировать?

И здесь на помощь приходит известный спортивный принцип – каждый играет так, как позволяет соперник. На языке математики этот принцип преобразуется в гипотезу, выраженную формулой

RiRij = -(RjRji)

Или словами – Разность между рейтингом участника и его парным рейтингом с определенным соперником равна разности между рейтингом этого соперника и его парным рейтингом с данным участником.

Эту же гипотезу можно представить в другом виде

Ri + Rj = Rij + Rji

Или словами сумма рейтингов двух участников равна сумме их взаимных парных рейтингов.

Гипотезу не доказать логически ее можно только подтвердить или опровергнуть обсчетом реальных турниров или искусственных примеров. Что и будет сделано ниже.

Итак, мы еще не определили абсолютную величину рейтинга, но, используя эту гипотезу, определили связь между рейтингами и парными рейтингами. Этот прием приводит, после некоторых математических преобразований к формуле, связывающей все рейтинги

Ri * Li = Sum Lji * Rj

Словами эту формулу можно описать так. За каждое поражение участник расплачивается в соответствии со своим рейтингом, а за свои победы получает в соответствии с рейтингом соперника. Ничьи рассматриваются как половинка победы и половинка поражения. Таким образом, при ничьей участники как бы обмениваются рейтингами и, естественно, ничья становится невыгодной для более сильного соперника.

Таких формул ровно столько, сколько участников турнира. Для того, чтобы получить абсолютные величины рейтингов необходимо ввести одно дополнительное условие.

Естественным условием может быть

Sum Ri = N * 1000

Сумма всех рейтингов равна числу участников умноженному на 1000

Другой, абсолютно эквивалентный вариант – положить рейтинг одного из участников равным единице или допустим - 1000.

Итак, мы получили систему линейных уравнений, в которой неизвестные это рейтинги участников, а коэффициенты – результаты партий между парами участников.

Вес победы.

Все же нам не уйти от необходимости решить вопрос об оценке самого факта победы.

Жесткая оценка (Hard)

Использование единицы для оценки победы и нуля для оценки поражения в алгоритме е-рейтинга означает, что победа рассматривается как абсолютное превосходство победителя над побежденным. При этом не важно каким числом оценивается победа – 1, 2 или 10, важно, что поражение оценивается нулем. При этом возникает ситуация, когда рейтинг победителя не имеет значения для определения изменения рейтингов участников. Все определяется рейтингом проигравшего.

Традиционная оценка (Traditional)

Можно считать, что победа Галкина над Палкиным означает просто, что Галкин имеет 2-й разряд, а Палкин 3-й. Или Галкин мастер, а Палкин кмс. По советской классификации это означает, что Галкин должен в матче с Палкиным набирать 75% очков. И в соответствии с этим победу Галкина мы будем оценивать в 3 очка, поражение Палкина в 1 очко. В этом случае изменения рейтингов на 75% определяется рейтингом проигравшего и на 25% рейтингом победителя.

Равная оценка (Equal)

Наконец, можно считать, что победа Галкина над Палкиным достаточно случайна, и их силы равны. Тогда имеет смысл оценку победы максимально приблизить к оценке поражения. В этом случае будем считать, что победа это 1000 очков, а поражение - 999.

Однако, свойство Е-Рейтинга таково, что соотношение оценок побед и поражений достаточно слабо влияет на результат ранжирования, а вот сами величины рейтингов, естественно, зависят весьма значительно

В таблице ниже дано распределение е-рейтинга п «стандартном» турнире из 8-и участников при различных значениях оценки победы. Оценка поражения равна 1.

При соотношении 5 к 1 первый оценивается вдвое выше чем второй

 Участник

W=2

W=3

W=4

W=5

W=10

Галкин

1,78

2,40

2,91

3,33

4,71

Палкин

1,42

1,60

1,66

1,67

1,45

Малкин

1,16

1,14

1,08

1,00

0,70

Чалкин

0,97

0,86

0,75

0,67

0,42

Залкинд

0,82

0,67

0,56

0,48

0,27

Иванов

0,70

0,53

0,43

0,36

0,19

Петров

0,61

0,44

0,34

0,28

0,15

Сидоров

0,53

0,36

0,28

0,22

0,11

 Возможен и еще "реальный" вариант оценки. В этом случае за оценку победы принимаем число очков победителя турнира, а за оценку поражения число очков последнего участника. Таким образом мы полагаем, что в одной партии отражается весь турнир.

Как “работает” е-рейтинг.

Начнем с организации турнира. Современная практика большинства турниров такова: все участники делают одинаковые взносы, которые составляют некий призовой фонд. По итогам турнира, в зависимости от занятых мест участникам вручаются призы.
1. Нередко победитель определяется за тур, а то и за два до конца турнира. Естественно, что лидер оставшиеся партии играет по настроению. И тут уж грех винить его в договорных результатах…
2. Участники не попадающие в число призеров также в значительной мере теряют стимул в последних турах. Вот и получается обилие коротких партий, которые раздражают всех. Да и самим шахматистам наверняка не очень то приятно отбывать номер.
Однако ситуацию можно исправить с помощью е-рейтинга. Для этого достаточно изменить правила формирования и распределения призового фонда.

Взносы участников должны определяться по результатам соревнования пропорционально рейтингу слабости R-.
Призы распределятся по рейтингу силы R+. Итоговый баланс и определяется общим рейтингом R = R+ +  R-

Посмотрим что получится для шахматистов нашей редакции. К счастью в турнир были включены еще трое шахматистов из соседней котельной – Иванов, Петров и Сидоров. Это позволит нам более наглядно продемонстрировать свойства е-рейтинга.
Простейший вариант. Турнир без “ошибок” Жесткая оценка победы

      Rnk  Name   1  2   3   4   5   6   7   8   В  Н  П ОН ОП  R+   R-    R
      ----------------------------------------------------------------------
       1  Galkin XXX 1   1   1   1   1   1   1   7  0  0 14  0  800   0   800
       2  Palkin  0 XXX  1   1   1   1   1   1   6  0  1 12  2   0    0    0
       3  Malkin  0  0  XXX  1   1   1   1   1   5  0  2 10  4   0    0    0
       4 Chalkin  0  0   0  XXX  1   1   1   1   4  0  3  8  6   0    0    0
       5 Zalkind  0  0   0   0  XXX  1   1   1   3  0  4  6  8   0    0    0
       6  Ivanov  0  0   0   0   0  XXX  1   1   2  0  5  4 10   0    0    0
       7  Petrov  0  0   0   0   0   0  XXX  1   1  0  6  2 12   0    0    0
       8 Sidorov  0  0   0   0   0   0   0  XXX  0  0  7  0 14   0   800 -800

В жестком варианте система определяет одного победителя и одного проигравшего. Галкин забирает весь приз. А Сидоров платит за всех. А что тут неправильного? Галкин – кмс – по сути сеансер, остальные для него клиенты, и как они там играют друг с другом для него неважно. Пришел заработал на пиво и ушел. А Cидоров, пошел играть за компанию с Ивановым и Петровым – вот и расплатился за банкет
Посмотрим как сработает е-рейтинг с “традиционной” оценкой победы (3 к 1)

      Rnk Name   1  2   3   4   5   6   7   8   В  Н  П ОН ОП  R+   R-    R
      ---------------------------------------------------------------------
       1  Galkin XXX 3   3   3   3   3   3   3  7  0  0  7 14  240  36   204
       2  Palkin  1 XXX  3   3   3   3   3   3  6  0  1  6 12  160  44   116
       3  Malkin  1  1  XXX  3   3   3   3   3  5  0  2  5 10  114  53    61
       4 Chalkin  1  1   1  XXX  3   3   3   3  4  0  3  4  8  86   67    19
       5 Zalkind  1  1   1   1  XXX  3   3   3  3  0  4  3  6  67   86   -19
       6  Ivanov  1  1   1   1   1  XXX  3   3  2  0  5  2  4  53   114  -61
       7  Petrov  1  1   1   1   1   1  XXX  3  1  0  6  1  2  44   160 -116
       8 Sidorov  1  1   1   1   1   1   1  XXX 0  0  7  0  0  36   240 -204

Здесь уже предполагается, что если Сидоров и проиграл всем, то это не значит, что он второй раз в жизни сел за шахматную доску. А просто были неприятности в котельной.
Теперь плата Сидорова за неудачу много меньше – 240 р. Много меньше и призовые Галкина – 240 р за первое место. Кстати, сотношение призов за первое и второе места 3 к 2 –м. Однако соотношение дохода от турнира у первого и второго несколь
Наконец посмотрим как сработает е-рейтинг при “равной” оценке (100 на 99) победы

      Rnk Name    1   2   3   4   5   6   7   8  В  Н  П ОН ОП  R+  R-    R
      ---------------------------------------------------------------------
       1  Galkin XXX 100 100 100 100 100 100 100 7  0  0  7 14 100 100  0,175
       2  Palkin  99 XXX 100 100 100 100 100 100 6  0  1  6 12 100 100  0,125
       3  Malkin  99  99 XXX 100 100 100 100 100 5  0  2  5 10 100 100  0,075
       4 Chalkin  99  99  99 XXX 100 100 100 100 4  0  3  4  8 100 100  0,025
       5 Zalkind  99  99  99  99 XXX 100 100 100 3  0  4  3  6 100 100 -0,025
       6  Ivanov  99  99  99  99  99 XXX 100 100 2  0  5  2  4 100 100 -0,075
       7  Petrov  99  99  99  99  99  99 XXX 100 1  0  6  1  2 100 100 -0,125
       8 Sidorov  99  99  99  99  99  99  99 XXX 0  0  7  0  0 100 100 -0,175

Здесь уже предполагается, что все участники турнира сильные второразрядники и результаты в определенном смысле “случайны”. Все делают одинаковый турнирный взнос. А призовые линейно зависят от занятого места. При этом необходимо договорится о призе для последнего участника. Если последний не получает ничего, то первый приз – 200 р. Системы распределения призов самые разнообразные. Чаще всего вознаграждаются первые три места в соотношении 5 – 2 – 1, или еще как-нибудь. Все зависит от фантазии организаторов. Казалось бы все справедливо. Но к каким это приводит последсвиям?

«Правильный турнир» Традиционный е-рейтинг

  1. «Жесткий рейтинг» Цена единственной ничьей лидера Галкина с аутсайдером Сидоровым.

Наказание за «гроссмейстерскую» ничью лидера с аутсайдером поистине жестоко. Лидер сразу потерял 280 очков. И только 40 очков идут аутсайдеру – Сидорову. 240 – уходят остальным участникам. При этом 140 получает второй – Палкин. И Сидоров поднимается на четвертую ступеньку. Понятно, что зная «характер» е-рейтинга вряд ли Галкин пойдет на договорную ничью, что было бы вполне естественно при очковой системе.

  Player W D L P ER

1

Galkin

6

1

0

7

520

2

Palkin

6

0

1

6

140

3

Malkin

5

0

2

5

47

8

Sidorov

0

1

6

1

40

4

Chalkin

4

0

3

4

23

5

Zalkind

3

0

4

3

14

6

Ivanov

2

0

5

2

9

7

Petrov

1

0

6

1

7

 

  1. «Жесткий рейтинг» Единственное поражение лидера Галкина от аутсайдера Сидорова.

Галкин расслабился и зевнул коня в элементарной трехходовке. А Сидоров хоть и играл слабо, но в эндшпиле все же провел ферзя. Реакция «жесткого» рейтинга на это событие была просто ужасна. Вместо того, чтобы забрать весь призовой фонд турнира 800 р. Галкин довольствуется суммой 369 р. Сидоров за удачу и упорство получит 62 р – меньше чем средний приз (100 р) все же он проиграл 6 партий из 7-и. Но выиграл у абсолютного лидера. А больше всех выиграл от этого курьезного результата – Палкин. Уступив лидеру он выиграл у всех и 215 р – награда за труд. Остальные участники тоже только выиграли от такого неожиданного результата. При этом Сидоров поднимается на четвертую ступеньку. Интересно, что результат такого исхода курьезной партии неоднозначен для Чалкина, Залкинда, Иванова и Петрова. В рейтинге они выиграли, но в рэнкинге (месте) проиграли, пропустив вперед Сидорова

 

  Player W D L P ER

1

Galkin

6

0

1

6

369

2

Palkin

6

0

1

6

215

3

Malkin

5

0

2

5

72

8

Sidorov

1

0

6

1

62

4

Chalkin

4

0

3

4

36

5

Zalkind

3

0

4

3

22

6

Ivanov

2

0

5

2

14

7

Petrov

1

0

6

1

10

 

  1. «Традиционный рейтинг» Единственное поражение лидера Галкина от аутсайдера Сидорова. По сравнению с «жестким рейтингом» случай единственного поражения лидера от аутсайдера оценивается не так драматично. И все же лидер теряет 50 очков. Аутсайдер получает 23 дополнительных очка. Остальные 27 очков потерянные лидерам распределяются между «зрителями». Больше всех – 8 достается второму призеру – Палкину. Сидоров при этом поднимается на 6-ю ступеньку.

  Player W D L P ER

1

Galkin

6

0

1

6

190

2

Palkin

6

0

1

6

168

3

Malkin

5

0

2

5

120

4

Chalkin

4

0

3

4

90

5

Zalkind

3

0

4

3

70

8

Sidorov

1

0

6

1

59

6

Ivanov

2

0

5

2

56

7

Petrov

1

0

6

1

46

Трудно сказать что справедливее – «жесткий» или «традиционный» вариант. Наверное здесь многое зависит от «сверхзадачи» турнира или организаторов. Если турнир отборочный, то, наверное, больше подходит «традиционный» вариант. Если же турнир финальный – то для дольше всего интригу сохраняет «жесткий» вариант.

 Как рассчитать е-рейтинг.

Е-Рейтинг требует решения системы линейных уравнений. Отметим, что с решением такой системы нас знакомили в четвертом классе. Это а*х + b*y = c. До пяти – шести участников это можно сделать вручную. В обычном «Excel», который есть на любом компьютере, есть встроенная функция расчета определителя матрицы, которая позволяет рассчитать е-рейтинг на рабочем листе для турниров до 250 участников минуты за три. Для расчета 1000 участников потребуется около получаса на обычном домашнем компьютере

Почему е-рейтинг.

Буква е в названии е-рейтинг в русском названии отражает слова «единый», «естественный» В английской транскрипции e можно интерпретировать как «enhanced» «electronic», «economic». И вообще мен буква е нравится.

Полная формула

Ri * (Wi * W + Li * L) = Sum (Rj * (Wji * W + Lji * L))

Ai * (Wi * L + Li * W) = Sum (Ai * (Wji * L + Lji * L))

Дoмoй
Bвepx
Е-Рейтинг
Корчному 75
Дж Нанн
Sonas Rating
СИНЧЕСС
Работа
Ничьи
Novgorod 97

Самые неприступные крепости в головах наших ...

Cлegyющuй

 Copyright Eugene Potemkin 1985 - 2004
For problems or questions regarding this web contact 271314@mail.ru.
Last updated: 03/26/04.

 

Hosted by uCoz