Обсуждение

WWRR / Вверх / СОДЕРЖАНИЕ / О ЧЕМ САЙТ / ДИАЛОГИ / ЛЕТОПИСЬ / New Page 1

Сухую статистику надо НЕ мочить, ее надо РАЗМАЧИВАТЬ, можно с пивом ...

Радио
о рейтингах
можно
спросить
пятницв
суббота
воскресенье
понедельник

17 30 - 18 00
т.729 33 68
т
.729 33 78
Прямой эфир
Радио СПОРТ

• WWRR •
• Вверх •
• МИР РЕЙТИНГОВ •
• ФУТБОЛ •
• ХОККЕЙ •
• ТЕННИС •
• ШАХМАТЫ •
• ФОРМУЛА 1 •
• ОЛИМПИАДЫ •
• CF •
• БЕНДИ •
• ВОЛЕЙБОЛ •
• ЭКОНОМИКА •
• БИБЛИОТЕКА •
• T1-12 МИФИ •
• Яхты ... •
• Гандбол •
• Об авторе •


Их бесконечное
множество
систем
сложения, 
вычитания,
умножения... .
Вопросы на
Форуме


Или в
Гостевой

book1.gif (20400 bytes)

Rambler's Top100 Service

271314@mail.ru

Как бы не изменялась игра – законы постоянны

Евгений Потемкин
Москва, Россия

Я с интересом слежу за развитием систем ранжирования в Американском студенческом футболе с 1995 года, когда впервые выйдя в Интернет познакомился с Девидом Вильсоном (David Wilson) и Кеннетом Массеем.(Kenneth Massey) С последним у нас даже завязалось сотрудничество и мы несколько лет вместе поддерживали сайт WWRR (World Wide Ratings and Rankings) Об этом была опубликована даже статья в Wall Streat Journal во время моего пребывания на Олимпийских играх в Атланте.

И эти наблюдения все больше убеждают меня в правоте известного правила «Если при решении частных вопросов вы не решите общие, вы постоянно будете спотыкаться об общую проблему» Да и сам заголовок статьи Ричарда Биллингслея (Richard Billingsley)  «As the game changes, so do the formulas» на ESPN, которая и вызвала желание откликнутся, как раз и говорит о постоянных модернизациях.

В отличие от мистера Richard Billingsley я не скрываю своего подхода а наоборот пытаюсь внедрить его в головы людей занимающихся спортом и как менеджеры, и как участники и как болельщики. Однако, как известно «самые неприступные крепости в головах наших» И честно говоря, мои успехи в популяризации моего подхода «е – рейтинга» не смотря на  сотни публикаций в центральных газетах и пять лет передачи «мир рейтингов» на московском радио, не очень то впечатляют.

В чем же основная причина неприятия е-рейтинга? Я думаю, что дело здесь примерно такое же как с шаровидностью Земли или Теорией относительности. Просто привычные взгляды на спортивные события слишком сильно отличаются от моих. Но значит ли это что я не прав? Судите сами.

Вот предпосылки на которых я основываюсь.

Спорт как общественное явление един и его законы едины. Неважно в чем вы соревнуетесь – в гонках Формулы 1, шахматах, спринте или футболе.

Для любого вида спорта существует «квант соревнования» Это игра в футболе, заезд в Формуле 1, партия в шахматах.

По результатам «кванта» происходит ранжирование. Простейшее ранжирование в играх: победитель- побежденный. Сложнее в гонках там результат не просто победитель и побежденный, участники расставляются по рангам – первый, второй, третий …

Ранжирование по итогам одного «кванта» (матча, гонки…) имеет ТОЛЬКО ОТНОСИТЕЛЬНЫЙ СМЫСЛ. Он означает что в данной встрече Иванов сильнее Петрова, ЮТА лучше НЕВАДЫ. Вгонках результат нам дает матрицу двойных сравнений: Шумахер сильнее Барикеллы и Вильнева, а Баррикела лучше Вильнева и т.д.

Для ранжирования по итогам одного сравнения не нужна никакая математика. Для этого нужны только правила того или другого вида спорта.

Математика нужна тогда когда надо свести воедино результаты нескольких парных (матчи, партии, встречи…) или множественных (забеги, гонки…) сравнений.

При определении итогового ранжирования недопустимо использование технических показателей характеризующих сравнение. (игру, матч, партию). Никому в голову не придет подсчитывать число ходов, комбинаций съеденных фигур при игре в шахматы. Важен лишь результат. Так и в футболе, счет имеет только вспомогательный смысл и не может иметь значения при подведении итогов всего чемпионата.

Однако философ сказал «все действительное разумно и все разумное действительно. Почему же бесчисленные ранжирования включают счет матча в рассмотрение? На мой взгляд это происходит из-за путаницы в целях стоящих перед ранжированием. Эти цели часто объединяют в одну. Это оценка результата соревнований и оценка силы соперников для предсказания результата «кванта» соревнований (партии, матча, гонки, забега).

Что касается подведения результата соревнования (чемпионата) то здесь должно соблюдаться условие – все «кванты» (матчи, забеги» должны иметь значимость не зависящую от последовательности. Другими словами результат на старте чемпионата и результат в конце соревнования одинаково влияют на итог. Также как например в марафоне время показанное на первых 100 метрах и время показанное на финишной прямой значат одинаково.

Для определения силы как раз наоборот, более ранние результаты имеют меньшее значение чем результаты последних встреч. Кроме того, для оценки силы участника (команды, спортсмена) важна и не монотонная ее зависимость от времени. Периоды подъема нередко чередуются с периодами спада. И пожалуй главное это отражение относительности результата- это наличие удобные и неудобные соперников. Таким образом, ранговая линейка является весьма негодным средством при определении силы. Ведь она (сила) зависит от соперника. С одним вы играете легко, с другим трудно. Здесь необходима матрица парных рейтингов а не единая табель о рангах для всех. И давать для целей предсказания единую табель о рангах значит заранее обрекать себя на неизбежные ошибки.

Дальше я буду говорить только о ранжировании для целей оценки результатов чемпионата.

Во всех рейтинговых системах, используемых для ранжирования команд студенческого футбола, как и в официальных ранжированиях таких солидных мировых организаций как ФИФА, АТР, ФИДЕ генетически заложено противоречие между относительным результатом и его абсолютной оценкой. Так или иначе все существующие системы основаны на первоначальной оцифровке побед и поражений.

Что бы модель ранжирования была принята большинством ее необходимо объяснить всем. Она должна быть понятной так же как понятна общепринятая нынче очковая система победил – получи очко, проиграл – ничего не получишь. Но очковая система сразу же натыкается на проблему оценки в случае множественного соревнования, где участники расположены по местам – первый второй третий. Сколько очков давать первому, второму и третьему еще вроде ясно 2 1 0. А если участников четыре и больше? Можно дать так 3 2 1 0, а можно и так 5 3 1 0. Можно вообще предложить другую систему оценок 6 4 1 0. Уже здесь мы натолкнулись на проблему неоднозначности решения. И проблема происходит из нашего желания сопоставить абсолютные очки относительным результатам

Итак в результате соревнований мы имеем матрицу парных сравнений. Как же ее свести к единой табели о рангах.

Е-Рейтинг.

Рейтинг вообще по определению величина относительная. В случае противоборства двух участников естественно принять определение рейтингов участников как отношение числа их побед и поражений. (Для простоты изложения ничьи просто опускаются. В дальнейшем ничья рассматривается как половинки побед и поражений)

Отметим, что абсолютная величина парных рейтингов не определена и не имеет значения. Совершенно одинаковый смысл имеют соотношения рейтингов 2 к 1, 10 к 5 или 300 к 150.

В любом турнире (нескольких турнирах) мы имеем матрицу парных рейтингов для всех пар участников. При этом часть клеток может быть пустой. Нам необходимо свести такую матрицу к набору чисел (рейтингов) однозначно характеризующих достижения каждого участника. Так, чтобы можно было расположить участников в соответствии с их достижениями.

В очковой системе ранжирование обеспечивается суммированием набранных очков, приравнивая все победы, ничьи и поражения.

Мы определим, что рейтинг участника в турнире (турнирах) равен среднему от всех парных рейтингов данного участника

Это определение ни сколько не менее обосновано, чем сумма очков в очковой системе.

Мы еще не определили абсолютную величину парных рейтингов. Что же будем суммировать?

И здесь на помощь приходит известный спортивный принцип – каждый играет так, как позволяет соперник. Математически это означает, что разность между средним рейтингом участника и его парным рейтингом с данным соперником равна разности между средним рейтингом соперника и парным рейтингом соперника с данным участником

Эту же гипотезу можно представить в другом виде. Сумма средних рейтингов двух участников равна сумме их парных рейтингов во встречах между собой.

Или словами сумма рейтингов двух участников равна сумме их взаимных парных рейтингов.

Гипотезу не доказать логически ее можно только подтвердить или опровергнуть обсчетом реальных турниров или искусственных примеров.

Итак, мы еще не определили абсолютную величину рейтинга, но, используя эту гипотезу, определили связь между рейтингами и парными рейтингами. Этот прием приводит, после некоторых математических преобразований к формуле, связывающей все рейтинги

Словами эту формулу можно описать так. За каждое поражение участник расплачивается в соответствии со своим рейтингом, а за свои победы получает в соответствии с рейтингом соперника.

Таких формул ровно столько, сколько участников турнира. Для того, чтобы получить абсолютные величины рейтингов необходимо ввести одно дополнительное условие.

Например сумма всех рейтингов равна числу участников умноженному на 1000

Другой, абсолютно эквивалентный вариант – положить рейтинг одного из участников равным единице или допустим - 1000.

Итак, мы получили систему линейных уравнений, в которой неизвестные это рейтинги участников, а коэффициенты – результаты партий между парами участников.

Конечно решение системы линейных уравнений не такая простая вещь, но должен напомнить читателям, что их этому учили в четвертом классе средней школы. Во всяком случае у нас в Караганде в Советском Союзе 1957 году. Мне тогда было 11 лет. Правда речь шла только о двух уравнениях с двумя неизвестными. Но это сути дела не меняет. Важно понять, что имея дело с относительными величинами как в спорте мы обязательно должны обратится к системам уравнений связывающих характеристики участников между собой.

А любые попытки использовать абсолютные очки и самые разнообразные поправки к ним обязательно приведут к выводу данному в заголовке статьи Ричарда Биллингслея (Richard Billingsley)  «As the game changes, so do the formulas»

Рейтинг согласия

В самом начале создания компиляции рейтингов для студенческого футбола я писал Кеннету Массею, что это неправильно по целому ряду причин. Во первых неверна сама процедура суммирования рангов, поскольку достаточно одного сумасшедшего поставившего абсолютного лидера по всем другим ранжированиям на последнее место и он оказывается незаслуженно «обиженным» Способ отбрасывания выпадающих рангов улучшаетситуацию но не решает ее в принципе.

Во вторых, преимущество остается не за самой лучшей, а за самой популярной системой. Например Эло является наиболее распространенной системой ранжирования, тогда как е-рейтинг не имеет аналогов. Понятно, что большинство последует за ранжированиями основанными на системе Эло.

И самое главное согласие не есть способ определения истины. Представьте себе что вопрос о форме Земли решался бы во времена Галилея голосованием. Наверное мы до сих пор бы ходили по плоской Земле.

Однако Кеннет остался при своем мнении и правильно сделал иначе мы не имели бы такой замечательной таблицы как College Football Ranking Comparison где собраны практически все известных систем ранжирования.

Эта коллекция и позволяет решать проблему итогового ранжирования не путем согласия, а путем выбора лучшей системы.

Критерий выбора системы ранжирования

Ну вот мы и подошли к казалось бы совсем другой проблеме от ранжирования участников к ранжированию «судей»

В компиляции Массея ранжирования расставлены по степени согласия с ранжированием «согласия». О недостатках этого ранжирования я уже говорил выше. Естественно, с моей точки зрения и согласие с общим мнением не может быть критерием отбора систем ранжирования.

С точки зрения абсолютной беспристрастности в качестве критерия отбора систем ранжирования можно наверное естественно взять количество «ошибок» ранжирования. Кеннет использует в своей таблице термин Ranking Violation . Именно по этому показателю намного впереди всех Steven Wrathell. Однако нам не все равно где совершаются ошибки понятно что ошибка в расстановке 2 и 3-й команды воспринимается обществом тяжелее чем ошибка в расстановке 102 и 103. Хотя с точки зрения последних это и не так.

Чтобы как-то решить эту проблему я предложил «взвесить» ошибки. При этом я паолностью согласен с Кеннетом что это лишь один из возможных способов

bulletThere are many possible measures of how well a ranking reflects actual results. In fact, that is how many models are defined. Potemkin suggested the following to weight violations based on ranking difference as well as importance.
·                 
·                                    sum(games with Rl > Rw) (Rl-Rw)*(2n-Rw-Rl)
·                weighted mistakes = ------------------------------------------
·                                                     1000
·                 
·                where n = # teams, Rw = rank of winner, Rl = rank of loser

В действительности здесь опять возникает проблема оценки (значимости) занятого места. И здесь мы возваращаемся к математике относительных величин которая используется в «е – рейтинге». Именно е-рейтинг позволяет на основании представления результата ранжирования нескольких участников в виде матрицы парных сравнений свести всю систему оценок каждого места к принятию единственного решения. Это решение можно принимать как на опросе, так и исходя из статистики. Этот вопрос звучит так. Как мы оцениваем победу одного участника над другим.

Математически это звучит так сколько стоит победа в сравнении с поражением. Например традиционоо победа – 1 поражение 0 По принципу все или ничего.

Другое решение победа с точки зрения оценки участников лишь немного лучше поражения то-есть 1000 на 999. С точки зрения традиционной очковой системы здесь нет разницы. С точки зрения е-рейтинга разница огромная. Наконец можно взят какой-то промежуточный вариант. Но это уже другая тема «нельзя объять необьятное»

Ранжирование без модели

Разбираясь с различными системами ранжирования, я внезапно пришел к такой мысле. Возможно она приходила в голову и не мне одному. Даже скорее всего это так. Просто мы зациклились на проблеме моделирования, вероятностей, матриц и другой математической чепухи.

В конце концов участникам чемпионата на так и важно каким способом вы ранжировали и что принимали во внимание. Важно чтобы как можно меньше было ошибок ранжирования, или как можно меньше была сумма “взвешенных” ошибок.

WWRR
Вверх
Юшкин
Massey
Glicko
Kessler
ФИФА
Работа
BCS poll
Е
Ничьи
M-Rating
FIFA/COCA-COLA
Обсуждение
Найгерд & Де Валь.
Sonas
Биллингслей
Божков
Диалог с гроссмейстером

 

WWRR Вверх
 Copyright Eugene Potemkin 1985 - 2005 271314@mail.ru. Last updated: 06/04/06.
 
Самые неприступные крепости в головах наших ...