| |||||||||
|
•
|
«Будь с народом проще и он к тебе потянется…» Рейтинг Эло заслуживает того, чтобы о нем говорить отдельно. Во-первых, это наиболее популярный, наиболее тщательно исследованный и с точки зрения теории и с точки зрения практики. Шахматисты накопили миллионы партий, участники которых были проранжированы этой системой. В русской литературе рейтинг Эло наиболее доходчиво был изложен в книге отца и сына Садовских. Математика и спорт / Л.Е. Садовский, А.Л. Садовский / М.: Наука, 1985. Собственно это изложение и возьмем за основу, чтобы еще раз пробежаться по этой идее и высказать (а как без этого) свои собственные соображения. Принципы построения спортивных классификаций Всякая спортивная классификация, основанная на упорядочении спортсменов по их силе (по результатам соревнований), связана с присвоением каждому из них определённой оценки, выражающейся в виде числа очков, набранных в турнирах, или в виде так называемого рейтинга – условного числового коэффициента. В пределах отдельных соревнований этими оценками служат очки, набираемые участниками. Именно так обстоит дело в соревнованиях по спортивной и художественной гимнастике, фигурному катанию, в тяжёлой атлетике и т.п. Однако в спортивных играх, таких, например, как шахматы, теннис, бадминтон, целесообразно иметь не разовую, а интегральную оценку, в которой учитываются (в определённом смысле суммируются) результаты серии встреч с различными противниками в разных турнирах на протяжении определённого отрезка времени. Такие интегральные оценки используются в шахматных, теннисных и других классификациях. Рассмотрение действующих классификационных систем позволяет сделать некоторые заключения общего характера и принципах их построения. Е: Авторы говорят и об очках и о рейтингах и о различных видах спорта, не пытаясь сопоставить эти понятия, привести их в строгую структуру взаимодействия между ними. Все термины подаются как изначально заданные, соответствующие реалиям спорта. Но по моему это неправильно. Об этом и пытаюсь рассказать здесь. Остановимся на системе классификации, на основе рейтингов. Оставим пока открытым вопрос о том, какие соображения учитываются при присвоении игрокам, входящим в классификацию исходного рейтинга (исходного места в классификации). Предположим, что вопрос этот тем или иным способом решён. Е. Такой уход от проблемы определения стартовых условий является как раз той общей проблемой, о которую потом долгие годы будут спотыкаться спортивные аналитики, использующие систему Эло. Это и проблема быстро прогрессирующих шахматистов. И «застой» в группе лидеров. И, в конечном счете разброд и шатания в шахматном мире. Рассмотрим встречу двух игроков. Обозначим оценки класса, т.е. рейтинги игроков U и V через r(V) соответственно. Все же здесь уместнее использовать термин «сила», оставив термин «класс» для дискретных величин. Конечно, это не принципиально, как назвать ту или иную величину. И все же мы не компьютеры и наше ассоциативное мышление часто выручает нас там, где подводит логика. Введём в рассмотрение переменную величину t, характеризующую различие в классе игроков U и V. Е: Да и само обозначение «t», скорее всего, взято по аналогии с t-критерием Стьюдента из статистики. Но кто из Вас читатели хорошо знаком с этим критерием? У кого это обозначение вызывает содержательные ассоциации? Не думаю, что таких много. А эта статья написаны для людей от спорта, во многом далеких от теоретической статистики. У меня был такой случай. Прихожу я в спорткомитет по заданию Дмитрия Рыжкова из Советского Спорта для того, чтобы взять письма с предложениями по модернизации системы проведения чемпионата страны по хоккею. Это было лет двадцать тому назад. Тогда многие писали и в газеты и в спорткомитет. Время было такое. Захожу в отдел, спрашиваю о таких письмах, а ребята хохочут. На возьми тут какой-то профессор про рыбу путассу пишет. Тебе пригодится. А человек писал о том, что результативность в футбольном чемпионате страны подчиняется закону Пуассона. Про Пуассона они не знали, а консервов с этой рыбой было полно в магазинах. Вот и весь научный разговор. Прав все-таки Ричард Фейнман – слова и термины в науке – основа. И чем меньше терминов, чем меньше «китайской грамоты» том быстрее и эффективнее дойдут до людей Не очень это удачное обозначение для игроков – U и V. Хотя для профессионала математика это абсолютно все равно. Но рейтинги строятся не для математиков! У нас это будет Иванов и Петров. Итак, в нашем понимании t есть различие (не путать с разностью) сил. Допустим, Иванов имеет силу 100 Е, а Петров – 90 Е. Обозначая единицу силы буквой Е, я просто хочу подчеркнуть, что сила игрока величина размерная. Думаю так будет проще разбираться в хитросплетениях построения модели. Величину t можно предположить зависящей, например, от отношения r (U) / r (V) рейтингов игроков U и V или же от их разности r(U) - r(V). Разность и отношение не единственные функции двух переменных, которыми можно характеризовать различие между двумя величинами. Например, чем плоха такая функция РАЗЛИЧИЕ = (Rи – Rп)/(Rи + Rп). Если сила Иванова много больше силы Петрова РАЗЛИЧИЕ стремиться к 1 если, наоборот Петров заметно сильнее – то РАЗЛИЧИЕ близко -1. Здесь хотелось просто обратить ваше внимание, что функций, характеризующих РАЗЛИЧИЕ может быть бесконечное множество, а не только привычные нам разность и отношение. В качестве исходного примем предположение, согласно которому отношение m/n среднего числа побед игрока U к среднему числу n его поражений в сериях из N встреч с игроком V находится в экспоненциальной зависимости от разности рейтингов игроков U и V. А вот это уже серьезное предположение. И с ним надо разобраться вплотную. Естественность такого предположения подтверждается статистическими данными о результатах шахматных турниров, теннисных и других игровых спортивных соревнований, а также, что не менее убедительно, нашими последующими результатами. Итак, мы принимаем, что m/n = at, где основание а экспоненты аt – некоторое число, большее единицы, а t=r (U) – r(V). А так ли уж хороша экспонента для реальных процессов? Прологарифмируем, как говорят математики, обе части этого уравнения. И мы получим выражение для разности сил Иванова и Петрова T=Ln(m/n)/Ln(a) Ln(a) – просто некоторая константа. Не будем обращать на нее внимание. Теперь, если Иванов выиграл у Петрова 100 партий из ста мы должны признать, что величина разности сил этих двух замечательных друзей – шахматистов = бесконечности. Для математика – ничего страшного. Для физика это катастрофа! В физике нет бесконечных величин! А разность сил для нас величина физическая! Мы даже размерность ей поставили – E. Совершенно очевидно, как хорошо не играл бы Иванов по сравнению с Петровым, всегда есть вероятность того, что он проиграет хотя бы одну партию. (Ну, зевнул же Каспаров компьютеру в недавнем матче.) А значит функция должна быть ограниченной при любом соотношении побед и поражений. Таких функций можно придумать множество. Одна из них – arctg. Напомню tg - функция величины угла – это отношение длин катетов в прямоугольном треугольнике (противолежащего к прилежащему). А arctg – 'это обратная функция. Она определяет величину угла в зависимости от соотношения длин катетов. Понятно, что эта функция не может быть по абсолютной величине больше чем величина прямого угла или 1,57…, если угол измерять в радианах. m/n = tg(t/a)/1,57… В этих обозначениях вероятность P (победа U) победы игрока U в рассматриваемой встрече игроков U и V равна отношению среднего числа выигрываемых U встреч к общему числу встреч с игроком V, т.е.
А в наших обозначениях P (Победа Иванова) = arctg(
Ясно, что величина Р (победа U) является функцией t. Так как переменная t равна разности r(U) - r(V) рейтингов соперников, то непосредственно видно, что при t = 0 (т.е. при равном классе игроков) вероятность Р(0) = ½: обе противоборствующие стороны могут выиграть встречу с равной вероятностью. При неограниченном увеличении (т.е. при неограниченном возрастании рейтинга игрока U по сравнению с рейтингом игрока V) вероятность Р(t) стремится к единице: игрок U почти наверняка выиграет у V. Если же t становится отрицательным (r(U) < r(V)) и неограниченно убывает, то вероятность Р(t) победы U над V неограниченно приближается к нулю.
Графики
функций Р(t) в зависимости от значения параметра а
показаны на рис. 31. График функции P1(t)=
.
С этой общей позиции можно объяснить идею построения уже ставшей классической (но пока не получившей в публикациях чёткого обоснования) системы классификации шахматистов, предложенной американским профессором А. Эло и принятой Международной федерацией (ФИДЕ) в 1970 г. Статистика шахматных турниров свидетельствует о том, что если один из соперников на один разряд (на одну ступень) в шахматной иерархии стоит выше другого, то первый выигрывает у второго, в среднем, 75 очков из 100 возможных, т.е. с вероятностью, равной 0,75. Е: У читателя может сложиться впечатление, что из статистики следует что перворазрядник выигрывает у второразрядника 75% партий. На самом деле все наоборот – сами разряды устанавливаются из принципа ¾ побед высшего над низшим. Мы с таким же успехом можем выбрать критерий 2/3 или 4/5. Просто при этом «разрядные ступеньки» будут либо крупнее, либо мельче. Вполне возможно, что в разных видах спорта они должны быть разными в зависимости и от природы спорта и от количества желающих заниматься. Впрочем это уже проблема тренеров, педагогов, организаторов. При построении кривой p(t), т.е. при выборе значения параметра а, этот факт следует учесть следующим образом. Предположим, что различие между игроками, принадлежащими к двум соседним ступеням (разрядам) шахматной иерархии, составляет λ единиц рейтинга. Иными словами, при t= r(U) - r(V)= λ величина вероятности победы U над V равна Р(λ)=0,75. Это предположение приводит к соотношению для определения значения а:
или аλ = 3. Допустив, например, что λ=200 из а200=3, найдём а=1,0055. Теперь можно подсчитать, что при разности рейтингов t=5
при t=10 P(10)=0,514; при t=15 P(15)=0,520; при t=20 P(20)=0,527 и т.д.
Посчитав
соответствующие вероятности P(t)
для разностей рейтингов в пределах t=0 до
t=735 (и больше), придём к таблице А. Эло (табл.10)
(она приведена, например, в
Величина ΔК - разность между коэффициентами Эло игроков равна в наших обозначениях значению t. Вот такие обычные для математика переобозначения, переопределения очень затрудняют понимание и без того трудного материала. Ведь читатель вовсе не обязан читать строчка за строчкой. Глянул начало, потом середину и в конец, за выводами, а там совсем другие буквы… А разбираться, уже и сил нет… Величины hб и hм из таблицы Эло (проценты, которые «полагается»набрать шахматисту с большим и, соответственно, с меньшим рейтингом) являются в действительности найденными выше вероятностями P (победа U) и P (победа V)=1- P (победа U). Полученное совпадение говорит о том, что в качестве отправной разницы в рейтингах в системе Эло принято число 200. Подчеркнём, однако, что можно предположить, вопреки Эло, что разница λ в рейтингах между представителями двух соседних ступеней шахматной иерархии должна составлять не 200, а скажем, 250 (или даже 300) единиц рейтинга. Это привело бы к другому, меньшему значению параметра а=1,0044, определяемому из уравнения а250=3, и, естественно,- к другой таблице, подобной, однако, таблице Эло. Весьма возможно, что пересчёт рейтингов игроков после завершения турнира с помощью новой таблицы окажется более удачным, чем по таблице Эло. Единственным обоснованием («оправданием»!) выбора значения λ=200 может послужить изучение объёмного статистического материала, накопленного в многолетних шахматных баталиях. Так или иначе имеется возможность построения целого семейства классификаций, подобных друг другу. Так, в частности, можно предполагать, что разница в рейтингах между представителями каждых двух соседних разрядов не должна быть постоянной, а меняться по мере продвижения вверх (от третьего разряда до гроссмейстера). Правда, это несколько усложнит процесс пересчёта рейтингов и потом вряд ли окажется практически целесообразным. Но вернёмся к системе Эло. Она завершается правилом пересчёта рейтинга шахматиста. Это правило формализуется в виде линейной зависимости rн=rcn+μ(N-Nож), Выражающей новый рейтинг (по завершении всего турнира) rн через старый рейтинг rст. (предшествующий турниру) и через разность между числом N очков, фактически набранных шахматистом, и числом очков Nож, которое ему «полагается», в силу его квалификации, набрать в турнире. Если фактически набранное число N очков совпадает с ожидаемым Nож, то из 91) следует, что рейтинг шахматиста остаётся без изменения: rн = rст. При N > Nож, т.е. при N - Nож >0, его рейтинг возрастёт, при N < Nож - станет меньше предматчевого. В системе Эло в качестве коэффициента μ выбрано число 10. Поэтому при N - Nож =1 из формулы rн=rcn+10(N-Nож),
следует, что рейтинг игрока возрастёт на 10 единиц. Иными словами, одному очку, набранному сверх ожидаемых соответствует 10 единиц рейтинга. Это обстоятельство является также своего рода «произволом». Можно положить, например μ=15 или μ=20. Реализация пересчёта требует знания величины Nож. Числовое значение Nож находится следующим способом (оно всегда округляется до полуочка и потому рейтинги всегда оказываются целыми числами). Допустим, что шахматист А, имевший рейтинг rст.(А) =2280, встретился в турнире с игроками D, C, D, E, имевшими рейтинги соответственно равные: rст.(В) =2280, rст.(С) =2285, rст.(D) =2270, rст.(Е) =2260. Тогда вероятность победы А над В составит 0,5 (отожествляется со средним числом выигранных очков), вероятность победы А над С равна 0,49 (так как rст.(С) - rст.(А) =5), вероятность победы A над D равна 0,514 (так как rст.(А) - rст.(D) =10), и, наконец, вероятность победы A над E равна 0,527 (так как rст.(А) - rст.(Е) =20). Следовательно, можно ожидать, что шахматист А во всех упомянутых встречах наберёт Nож(A)=0,500+0,490+0,514+0,527=2,031 очка.
Подсчёт Nож упрощается путём введения так называемого рейтинга r(т) турнира, равного среднеарифметическому рейтингов всех его участников. Е: Такое усреднение накладывает жесткие требования на участников одного турнира. При достаточно большом разбросе личных рейтингов расчеты становятся весьма приближенными. Ситуацию спасает то, что рейтинг Эло есть «рейтинг силы», а значит по своей природе вполне достаточно 10% точности Классификационная система Эло основана, как можно заключить из предшествующего, на трёх предположениях: 1) отношение среднего числа выигранных к общему числу сыгранных шахматистом со своим противником партий находится в экспоненциальной зависимости от разности рейтингов играющих сторон; 2) разница в рейтингах шахматистов двух соседних разрядов шахматной иерархии составляет 200 единиц рейтинга; 3) одному набранному (свыше ожидаемого числа) очку соответствует 10 единиц рейтинга. Таким образом, система Эло имеет определённое теоретико-статистичесоке обоснование. Её правомерность подтверждена статистической достоверностью прогнозов. В системе Эло вводится начальный рейтинг. Для оценки силы этот прием оправдан, поскольку, рейтинг Эло постепенно «забывает» прошлые результаты. А как быть в оценке результатов турнира? Если установить всем одинаковый рейтинг, то возникает проблема «расписания» - тот, кто встречается с более слабыми соперниками на старте имеет преимущество. Введение же перед турниром разных стартовых рейтингов – вообще не приемлемо. Эло для международного футбола Рейтинг рассчитывается по следующей формуле Rn = Ro + K × (W - We) Rn рейтинг после матча, Ro рейтинг до матча. K константа определяемая значимостью матча 60 for World Cup finals; 50 for continental championship finals and major intercontinental tournaments; 40 for World Cup and continental qualifiers and major tournaments; 30 for all other tournaments; 20 for friendly matches. Е. Ну, конечно же, здесь идет смешение понятий «достижение» и «сила». Что означает введение коэффициента К? По логике этого алгоритма получается, что для достижения такого-же результата как в матче чемпионата мира в товарищеских играх команда должна выиграть три матча! Это чистая эмпирика. Впрочим об этом уже говорилось в обсуждении рейтинга ФИФА – Кока кола. Далее K корректируется с учетом разности мячей в игре. К увеличевается наполовину, если разность мячей +2, ¾ - если разность равна +3, и 3/4 + (N-3)/8, если разность +4 и более, где N – разность мячей. Е. Вообще такая зависимость очень похожа на ту, которая получается, если рассматривать забитые и пропущенные мячи как «признаки» победы. Отметим, что в этой логике матч, завершившийся со счетом 5-3 имеет такой же вес, как и матч, завершившийся со счетом 2-0. У меня нет ни какой уверенности, что это одно и тоже. А у Вас? Ну а случись счет 11-0 мы вообще получим, что один матч выигранный с таким счетом на чемпионате мира равен 8 нормальным товарищеским матчам просто выигранным у соперника. Конечно такого не будет, но обычно модели проверяются на крайностях. W – результат игры (1 победа, 0.5 ничья, and 0 поражение). Отметим, для себя, что здесь нет места произвольной очковой оценке, которая принята в современном футболе (3-1-0). Дело в том, что здесь величина W имеет смысл вероятности и как бв говорится, что победившая команда на 100% сильнее проигравшей, а при ничьей вероятность с которой можно утверждать, что одна из команд сильнее равна 50% We предполагаемая вероятность победы, эта вероятность определяется графиком заданным следующей формулой: We = 1 / (10(-dr/400) + 1) dr разность рейтингов до матча плюс 100 очков для команды играющей дома.
|
|
|