|
26.03.2004 Олимпиады
|
Статья Джона Нанна, опубликованная в «64» попалась мне на глаза случайно при переезде. Я давно хотел как-то отреагировать на нее, но «перестройка» поменяла все планы и вот она опять у меня на столе. С тех пор прошло лет пятнадцать и многие проблемы шахматного ранжирования сейчас не актуальны. Однако главные вопросы так и не решены…Евгений Потемкин. 271413@mail.ru «64» Предложение по модификации международной системы рейтинговДжон Нанн, гроссмейстер, доктор математики Публикуемый доклад известного английского гроссмейстера и доктора математики был предложен на конгрессе ФИДЕ в качестве одного из документов квалификационного комитета. Решено провести по этому вопросу широкое обсуждение в национальных федерациях и затем вернуться к проблеме на следующем конгрессе. 1. ВведениеМеждународная система рейтингов (далее МСР) стала с годами одной из наиболее важных черт шахматного мира. Шахматисты с большим интересом ожидают выхода полугодичной таблицы рейтингов, и того, кто возглавит таблицу, ожидает большой престиж - независимо от того, будет ли им официальный чемпион мира или нет. Рейтинг шахматиста - один из важнейших факторов, влияющих на его карьеру. Организаторы соревнований стремятся достигнуть как можно более высокой категории для своих турниров, не только с целью помочь участникам выполнить нужные нормы, но и из рекламных соображений. Поэтому высокий рейтинг способствует получению приглашений на важные турниры и, как правило, влияет на гонорар шахматиста за участие в турнире. Теперь, когда шахматисты с достаточно высоким рейтингом имеют свободный выход на межзональные турниры, МСР приобретает еще большую значимость. Можно долго спорить о том, может ли обыкновенный числовой показатель адекватно отразить умение человека, играющего в шахматы, игру, содержащую в себе художественные элементы, но рейтинги стали теперь неотъемлемой частью современных шахмат. Учитывая значение рейтингов для каждого шахматиста, важно, чтобы МСР как можно точнее отражала качество игры тех шахматистов, которые включаются в таблицы рейтингов. Настоящий доклад имеет целью предложить модификацию существующей МСР, что позволит устранить некоторые аномалии в МСР и значительно упростить ее. Вероятностные таблицы профессора Эло, связывающие разницы в рейтингах с ожидаемым количеством набранных очков, останутся в основе системы, а наша модификация коснется лишь метода использования этих таблиц для подсчета рейтинга. А вместе с тем рейтинг Эло и является основной причиной претензий шахматистов к рейтингам. Какая бы система рейтингов ни применялась, ее данные будут столь же точны, сколь точны предварительные данные, вводимые в эту систему. Турнир в Линаресе 1983 г. не был учтен при составлении таблицы рейтингов на июль 1983 г., и поэтому, например, рейтинг Сейравана оказался выше того, который был указан в этом списке. Однако он пострадал при подсчете рейтингов на январь 1984 г., когда данные Линареса были приняты во внимание, потому что рейтинг его оказался ниже, чем мог бы быть в случае учета Линареса в соответствующем рейтинг-листе. Это замедленное действие, присущее теперешней системе, исключает возможность исправления подобных ошибок. От ошибок операторов не гарантирована ни одна система. Хотя сейчас в 2003-ем году, проблема «контроля за вводом информации» – решена. Просто, более современная техника, по сравнению с техникой и технологией десятилетней давности, позволяет снять все проблемы и для этого не надо менять рейтинг. В предлагаемой системе каждый рейтинг определяется независимо, так что любые имеющие место пропуски могут быть без труда за. регистрированы. 2. Аномалии современной системы рейтинговДопустим, что мы. имеем дело с двумя шахматистами, «А» и «Б», у которых рейтинг 2500. Шахматист «А» играет в пяти турнирах в течение соответствующего рейтинг цикла (равного в настоящее время шести месяцам). В четырех турнирах он набирает 4,5 (из 9) при среднем рейтинге противников 2500, а в пятом он набирает 1,5 (из 9) при том же среднем рейтинге оппонентов. Шахматист «Б» участвует только в пятом турнире и завершает его с тем же результатом— 1,5 (из 9). По правилам действующей ныне системы рейтингов, оба теряют 30 очков, и в следующем рейтинг-листе он составляет 2470. Однако впечатление такое, что «А» за истекший период играл лучше, чем «Б» и поэтому рейтинг его должен быть выше. Вот где собака зарыта! Просто путаются два понятия! И это характерно для всего спорта вообще, а не только для шахмат! Что такое рейтинг? Это мера СИЛЫ. А, следовательно, сколько бы шахматист «А» не играл циклов, если он показывает 2500, то это и есть 2500. Разница с шахматистом «Б» только в том, что достоверность этих 2500 у него выше. Но ведь рейтинг Эло отражает СИЛУ шахматиста и, если в последнем рейтинговом периоде они сыграли одинаково плохо, значит - и их сила одинаково изменилась в худшую сторону. Тем более, когда речь идет о циклах в полгода. Время, наверное, достаточное чтобы изменить шахматную силу. Сегодня это время составляет 3 месяца и может быть сейчас даже уместнее говорить о достоверности измерения СИЛЫ рейтингом. Но это уже другой вопрос. Второе понятие, это РАБОТА (или достоверность СИЛЫ) шахматиста. Вроде бы хочется поставить шахматиста сыгравшего 5 рейтинговых циклов на уровне 2500 выше того, кто сыграл лишь один цикл на этом уровне. Но, согласитесь, что не меньше оснований поставить его НИЖЕ! Дело в том, что тот, кто играет постоянно на одном уровне много лет, имеет меньше шансов резко снизить его, но и меньше шансов резко повысить его. Тогда как прогрессирующий шахматист более вероятно увеличит свою силу. Хотя и с большей вероятностью может показать более низкий результат. Итак, нельзя смешивать два понятия Работа и Сила. Это вызвано искусственным разделением результатов шахматиста на турниры, каждый из которых учитывается отдельно. Вторая проблема возникает в случае шахматистов, чей рейтинг меняется быстро. Чаще всего это бывает с молодыми шахматистами, быстро идущими в гору, Так как новый рейтинг подсчитывается прибавлением разницы к старому рейтингу, то шахматисту с первоначальным рейтингом 2220, оказывается очень сложно поднять его до 2400, даже если последний выражает его истинную силу. Для таких шахматистов был введен фактор «К», достаточно высокий для всех тех, кто впервые включается в таблицу рейтингов, но постепенно понижающийся по мере увеличения числа партий, результат которых учитывается при определении рейтинга. Этот метод обращения с молодыми шахматистами трудно назвать изящным, ибо он является не составной частью МСР, а последующим дополнением для тех случаев, с которыми стандартная система не справляется. Для Е-Рейтинга нет этой проблемы, поскольку нет деления на старый – молодой, растущих – сходящий со сцены и т.д. Есть только результаты партий за определенный период. Необходимость введения коэффициента «К» - следствие недостатков рейтинга Эло. Дело в том, что в рейтинге Эло обязателен исходный рейтинг. Что на первый взгляд соответствует спортивному принципу «на старте все равны». Это неправильное понимание спортивной справедливости. На мой взгляд принцип спортивной справедливости означает – «на старте все одинаково неизвестны» Более того, при К, равном 25, шахматист может получить официальный рейтинг, превышающий его рейтинги по отдельным турнирам! Например, шахматист с рейтингом 2300 и трижды добивающийся результата 5,5 (из 11) при среднем рейтинге противников 2430, получит новый рейтинг 2450. Было бы лучше, если бы система рейтингов придавала больше веса более ранним результатам и обходилась без существующих дополнений. 3. Предлагаемая модификацияВ предлагаемой системе новый рейтинг определяется на основе последних 80 партий шахматиста. Если за рейтинг-период сыграно более 80 партий (что очень маловероятно), то новый рейтинг определяется при учете всех партий. Если же сыграно меньше, то недостающие партии берутся из предыдущего рейтинг периода. Поэтому впервые опубликованный рейтинг новых шахматистов будет отражением всех когда-либо сыгранных подотчетных партий. Первоначальные результаты должны выпасть из подсчета рейтинга только тогда, когда сыграно 80 подотчетных партий. Единственное исключение составляют неиграющие шахматисты. Если кто-нибудь не сыграл ни одной подотчетной партии в течение, скажем, 4 лет, то следует считать, что этот шахматист не обладает рейтингом до тех пор, пока он не приобретет новый. Целью этого правила является устранение рейтингов, основанных исключительно на старых данных. Особого смысла в числе 80 нет в предлагаемой системе. Можно было бы воспользоваться любым другим числом. Но, интересно заметить, что это – единственное, произвольное число в предлагаемой системе. Выбор 80 составляет большой запас прочности; при более низком числе система реагировала бы лучше на колебания, но только за счет уменьшения «амортизации». 4. Примеры и сопоставлениеДля проведения конкретных подсчетов мы возьмем два примера — уже признанного шахматиста и шахматиста, впервые включаемого в рейтинг-лист. Мы приведем данные подсчетов, сделанных как с помощью действующей системы, так и предлагаемой. ПРИМЕР 1.Нет смысла брать для рассмотрения очень ровно играющего шахматиста, потому что в этом случае любая система рейтингов приведет к одному и тому же ответу. Поэтому мы возьмем такого, чей рейтинг в первом периоде равен 2500, во втором и третьем падает до 2400, а в четвертом и пятом периоде вновь поднимается до прежнего показателя. Для предлагаемой системы необходимо располагать некоторыми результатами до начала первого периода. Предыстория;
Предполагается, что на этом этапе официальный опубликованный рейтинг составляет 2500.
А теперь мы можем подсчитать рейтинг за первый период с помощью действующей системы. Для первого периода разница составляет 82 пункта, равных по официальной таблице 0,39; ожидаемый результат поэтому будет : 0,39 Х 11=4,29. Действительный результат — 5 очков, поэтому разница составляет: 10 Х (5 — 4,29)=7 пунктов, Эти операции дает следующие общие итоговые данные по изменению рейтинга: +7, — 11,+6, — 2, — 4, Итоговая разница — 4 и при округлении до 5 в конце первого периода шахматист получит свой официальный рейтинг 2495. Каждый турнир требует тщательного подсчета и ссылки к таблице пересчета, Теперь же рассмотрим тот же период на основе предлагаемой системы. За это время было сыграно 57 партий, поэтому необходимо включить в предысторию все турниры, состоящие из 9 туров и 5/11 турнира из 11 туров, то есть взять из этого турнира 6,5 Х '5/11=3 (5} для набора 80 партий. Подсчет результатов дает - 44,5, (из 80) = 0.51875. при среднем рейтинге противников равном {13Х2420+11Х2460+9Х2343+13Х2578+11Х2582+9Х2410+9Х2570+5X 2475}.80=2484. Так как 0,51875 конвертируется в +13, то это дает рейтинг 2497,который округляется до 2500 в официальной таблице рейтингов. Заметьте, что я в вышеприведенных подсчетах интерполировал стандартную таблицу. В предлагаемой системе понадобились бы таблицы с трехзначной точностью для диапазона примерно в 50 процентов. Это во многих отношениях выгодно, потому что величины, которые должны быть пересчитаны, находятся ближе к середине таблицы, где она должна быть более точной. Преимущество предложенного метода очевидно по приведенному подсчету — весь подсчет рейтинга сводится к простой арифметике, в то время как при современной системе необходимы подсчеты для каждого турнира. Простота не должна быть ни целью, ни критерием. Простота возникает сама при правильной постановке задачи и правильном моделировании Полагаю, что новый метод требует только половину того времени, которое тратится на подсчеты по современному методу. В следующей таблице приведены рейтинги, определенные обоими методами в конце каждого рейтинг-периода для использованного нами примера:
Результаты очень схожи, но есть некоторые расхождения, на которые следует обратить внимание. Действующая система ведет к асимптотическому подходу к данному рейтингу, предполагая постоянный уровень игры, то есть шахматист, играющий в силу 2400, на каждом турнире будет достигать этого уровня все более и более медленно (если только он не будет играть огромное количество партий) и в конце концов получит официальный рейтинг 2400 только благодаря округлению. Этот эффект очевиден в случае вышеприведенного рейтинга 2420, который выше рейтинга на третий период (2406). Предлагаемая система определяет конкретный рейтинг на основе 80 партий и указывает рейтинг 2405. Хотя эта система начала с первоначально низкого уровня, с момента начала роста, она привела к правильному рейтингу (2506) как минимум столь же быстро, сколь и действующая. ПРИМЕР 2.Возьмем теперь молодого шахматиста, который в начале сыграл всего лишь несколько партий, но вскоре появился на международной арене и впервые попал в таблицу рейтингов. Сила его растет от 2235 в первом периоде до 2470 в пятом.
По действующей системе первый опубликованный рейтинг является слегка модифицированным показателем игры, и на основе данного выше результата он будет равен 2230. После этого новый рейтинг шахматиста определяется по старому обычным способом, кроме переменного фактора К. В вышеприведенном примере первый период основан на К=25, в третьем и четвертом К=15, в пятом К=10. Предлагаемая система в сущности та же, что и в первом примере, с тем лишь исключением, что первоначально нет 80 партий. Например, рейтинг в конце второго периода основан на результате 15 (из 31) против среднего рейтинга (13Х2320+9Х2241+9Х2278)/31 = 2285. Так как 15 (из 31)= 0,484, равном — 11, то это дает рейтинг 2274, округляемый до 2275. В предлагаемой системе шахматист получает свой официальный рейтинг после того, как он сыграет 9 партий с обладающими рейтингом противниками (как и в действующей), если даже эти партии не входят в один турнир. В отличие от действующей системы партии с противниками, не обладающими рейтингом, не принимаются в счет, кроме рейтингов, определяемых после данного рейтинг-периода, о которых речь пойдет ниже. Вот результаты по двум системам:
И вновь результаты расходятся лишь слегка. В частности, небольшое отставание в предложенной системе (вызванное действием фактора «К» в нынешней) быстро восполняется с началом стабилизации результатов. Предложенная система ведет себя хорошо, потому что ранние плохие результаты, которые все еще присутствуют в системе, постепенно разбавляются включением все большего количества новых результатов. После 80 партий они исчезают полностью. Можно спорить о том, что предлагаемая система позволяет шахматисту получить очень высокий первоначальный рейтинг, основанный только на 9 партиях, что, может быть, не является отражением истинной силы игры. Однако данный рейтинг будет иметь силу только в течение шести месяцев и, если первоначальный уровень не будет поддерживаться, то он вскоре будет подорван новыми результатами. В любом случае целью любой системы рейтингов является оценка игры шахматиста и если доступная информация указывает на высокий уровень шахматиста, то справедливо и вознаграждение его высоким рейтингом. Подводя итог, можно сказать, что новый метод дает результаты, очень близкие к результатам действующего метода во всех нормальных ситуациях. Но он легче и не страдает от тех парадоксов, которые в общих чертах были описаны во второй части. 5. Послетурнирные рейтингиЯ полагаю, что одним из важнейших факторов любой системы рейтингов является возможность подсчитывать свой собственный рейтинг. Если такое невозможно, то шахматист никак не сможет обнаружить возможную ошибку в его опубликованном рейтинге. По моему, это примерно то же, как каждому легкоатлету иметь свой секундомер, на тот случай, если электронная система даст сбой! J Когда Сосонко и Разуваев потеряли по 200 пунктов в рейтинг-листе за июль 1983 года, ошибка оказалась достаточно очевидной, Ну а что, если вместо 200 были бы утеряны только 102. В этом случае, вероятно, никто бы не заметил ошибки. 20 лет назад проблема ошибок была актуальной. Но ведь тогда и был один компьютер на всю ФИДЕ! Сейчас это просто не актуально. Простота, таким образом, имеет здесь три преимущества: она сокращает административную нагрузку, уменьшает шансы на ошибку и облегчает обнаружение и исправление ошибки, если она все-таки будет иметь место. Для исправления ошибки должна существовать соответствующая процедура, позволяющая шахматисту опротестовать свой рейтинг, а любой серьезный и документально обоснованный протест должен быть рассмотрен соответствующим чиновником. Однако использование послетурнирных рейтингов ставит шахматиста в очень трудное положение, потому что он никак не может узнать о том, открыто ли уже досье на оппонента, предположительно не обладающего рейтингом (а это повлияет на его собственный рейтинг). Шахматист должен иметь возможность сосчитать собственный рейтинг с использованием общедоступной информации, а именно положений по рейтингам и таблиц рейтингов. Шахматист ДОЛЖЕН только одно - играть на выигрыш в любых ситуациях, а система оценки его достижений ДОЛЖНА ВСЕГДА положительно оценить его ПОБЕДУ. В зависимости от класса соперника, оценить его ничью как положительный или отрицательный результат, и «осудить» поражение. А вот «поощрений» и «штрафов» за результат – это отдельный разговор. Более того, после турнирные рейтинги громоздки в применении, особенно в случае турниров, проводимых по швейцарской системе. Так как предлагаемая система рейтингов основана на рейтинг-периодах, а не на отдельных турнирах, то после. турнирные рейтинги исключаются так или иначе. Если есть необходимость в использовании ретроспективных рейтингов, то куда более целесообразно использование пост периодных рейтингов так, чтобы шахматисты, которые достигли соответствующего рейтинга в какой-то определенный период, могли вначале получить его и только после этого считать, что они обладают рейтингом, как и их противники в том же периоде. Такая система гораздо легче ныне действующей и позволяет шахматистам просмотреть таблицы рейтингов и определить, кто из его неклассифицированных» оппонентов был засчитан как «классифицированный». В целом, однако, думаю, что ретроспективные рейтинги не стоят административных хлопот и непредсказуемых последствий от включения в систему неточных рейтингов. |
|
|