Л-Рейтинг

WWRR / Вверх / Радио СПОРТ / T1-12 МИФИ / ВОЛЕЙБОЛ / ЯХТЫ... / Гандбол / ОКНА Е-НОТА / ФОТО Е-НОТА / Е КЛУБ / Об авторе / ЧР 2006 Суперфинал / Мемориала Таля / Верхняя страница 1

Сухую статистику надо НЕ мочить, ее надо РАЗМАЧИВАТЬ, можно с пивом ...

 


Без трафика
Сеть NETORN
Поток: Слушать

 

• WWRR •
• Вверх •
• Радио СПОРТ •
• T1-12 МИФИ •
• ВОЛЕЙБОЛ •
• ЯХТЫ... •
• Гандбол •
• ОКНА Е-НОТА •
• ФОТО Е-НОТА •
• Е КЛУБ •
• Об авторе •
• ЧР 2006 Суперфинал •
• Мемориала Таля •
• Верхняя страница 1 •


Гостевая

Rambler's Top100 Service

271314@mail.ru

bullet

ФУТБОЛ

bullet

ШАХМАТЫ

bullet

У.Е.НОТА

bullet

ХОККЕЙ

bullet

ТЕННИС

bullet

ЭКОНОМИКА

bullet

ОЛИМПИАДЫ

 

ИНДИВИДУАЛЬНЫЙ РЕЙТИНГ

ИНДИВИДУАЛЬНЫЙ РЕЙТИНГ. 1

bullet

Статистика члена команды... 2

bullet

Модель свободного времени.. 3

bullet

Игровое время. 3

bullet

Принцип занятости. 3

bullet

Принцип идеальной эффективности. 3

bullet

Польза и вред «хулиганов». 4

bullet

Свободное время. 4

bullet

Фиксируемые действия. 4

bullet

Скрытые действия. 5

bullet

Результат. 5

bullet

Успех. 5

bullet

Равенство атаки и обороны.. 5

bullet

Лучшие в истории НХЛ.. 6

bullet

Наша футбольная сборная. 8

bullet

Модель свободного времени в футболе. 8

bullet

Совет с обществом.. 9

Статистика члена команды

Более-менее разобравшись с ранжированием «участников» соревнований перейдем к не менее актуальной задачи – ранжированием «членов команды».

Команды в спорте, как известно двух видов. В «простых» командах их результат определяется математической комбинацией результатов членов команд. И в этом случае задача сводится к тем же проблемам ранжирования участников. При это будем рассматривать только «сложные команды».

В сложных командах действия членов команд практически невозможно разложить на простые элементы. А значит невозможно и простыми способами определить вклад каждого.

Нередко встречается механистический подход при решении обратной задачи. Пытаются на основании личного ранжирования составить и, главное, прогнозировать результаты команды. Вряд ли это путь к успеху. Команда звезд и команда-звезда, как известно вещи совершенно разные.

Итак, задача - как определить лучшего игрока? Не лучшего нападающего, не лучшего защитника, а игрока. Рассмотрим ее на примере НХЛ. Там собрана одна из лучших коллекций статистики. Похожая статистика разве что в НЬА.

Вообще вся статистика традиционно уделяет внимание нападающим. И это естественно, шайбы и результативные передачи считать легко. А что делал на площадке защитник? Бог его знает. Путался в ногах у нападающих и мешал играть. С вратарями - немного полегче, - у них с некоторых пор броски по воротам считаются, ну и конечно пропущенные шайбы – «компромат» на вратаря копится. А если вратарь играл в слабой команде? И колотили в него шайбами кому не лень?

Модель свободного времени

Сотворить чисто статистическую, модель не так уж и сложно. Однако замучаешься потом искать здравый смысл. Поэтому, сначала сообразим насчет некоторой модели, так сказать "физической" взгляд на природу хоккея.

Игровое время

На все игровые действия тратится время. Все время игрока - это сыгранные матчи - GP. Или чистое время на площадке. Это не очень важно, хотя некоторые любители статистики будут отчаянно доказывать, что чистое время и число игр вещи, ну совсем разные. Согласен, но для модели эти различия не существенны. Для нас и т и другое это - «ресурс», который достался игроку волею судьбы и тренера.

Можно услышать возражение, что игровое время показатель субъективный он слишком зависит от каких-то сугубо личных отношений. Например не понравился парень тренеру и хороший хоккеист остался за бортом. Но мы исходим из «презумпции невиновности» тренера – каждый тренер желает только хорошего и себе, и игроку, и команде. А с другой стороны мы живем, как уже не раз было сказано в вероятностном, релятивистском мире. И фактор случайности, относительности показателей будем принимать как должное. Наконец, мы говорим об оценках деятельности игрока на основании этой самой деятельности, а не на основании предпосылок к этой деятельности. Какими являются например, рост, вес, умение проводить технические и тактические действия.

Принцип занятости

Будем считать, что каждый игрок от вратаря до нападающего все время на площадке занят полезным делом. В хоккее он забивает шайбы, делает результативные передачи или штрафуется и т.д. И даже если в итоговых протоколах он не значится в статистике фиксируемых действий, все равно он делал что-то полезное для команды. Например рассказывал анекдоты.

Принцип идеальной эффективности

Мы полагаем, что все игроки обладают одинаковой (максимальной) способностью забивать шайбы, делать результативные передачи, и зарабатывать штрафы и вообще совершать любые фиксируемые в статистике действия. Причем интенсивность этих действий равна, или несколько превышает лучшие показатели всех игроков.

Здесь важно правильно определить период набора статистики. Например, если вы ранжируете игроков по результатам данного сезона, то и максимальные показатели естественнее всего брать из статистики этого сезоне. Если же вы пытаетесь найти лучшего за десятилетие, то надо брать и соответствующую статистику.

Возможно определение максимальных показателей и за всю историю. Правда при этом надо обращать внимание на постоянство сути самой игры.

Итак, на забивание голов игрок тратит время, которое равно числу заброшенных им шайб деленному на максимальную результативность бомбардиров. Здесь можно взять и максимальную результативность в данном сезоне или за всю историю. В зависимости от того, за какой период мы хотим провести ранжирование.

В НХЛ максимальная результативность 1.93 шайбы за игру у лучшего нападающего в среднем за всю карьеру. Но мы строим модель, поэтому будем считать, что это порядка 2-х шайб или чуть больше. Подчеркнем, что «максимальная скорострельность» это все-таки свободный параметр в нашей модели. Его можно изменять, и в принципе он должен утверждаться экспертным советом. А задача математика объяснить экспертам, что к чему, и показать, что происходит с ранжированием, если этот параметр изменить в ту или другую сторону.

Точно также определяем время, затраченное игроком на результативные передачи В НХЛ этот показатель порядка 5 пасов за игру в среднем за карьеру.

Аналогично - с штрафными минутами. В НХЛ  высший показатель - около 6 минут за игру в среднем за карьеру. Для нас важно конечно не количество минут, а количество штрафов. Будем считать, что все штрафы двухминутные. Это приближение конечно, но уверяю вас более точная статистика мало скажется на итоговом ранжировании.

Итак мы считаем что каждый игрок забивает как лучший бомбардир, пасует как лучший пасующий и штрафуется как самый "хулиганистый" хоккеист в НХЛ.

Польза и вред «хулиганов»

Отдельно о "хулиганах". Мы полагаем, что действия штрафников направлены на пресечение атак соперников. Если бы это было просто хулиганство, то вряд ли тренер держал бы такого игрока долго на поле. Поэтому мы будем считать, что штраф - это прерванная атака, не забитый гол в свои ворота, а значит, штрафные могут быть рассмотрены наравне с пассами и голами.

С другой стороны, штраф в хоккее это, как правило, - удаление и больший риск пропустить шайбу. Оставим в стороне вопрос о «конституционной» правомерности удаления игрока без замены. Достаточно того, что негативные последствия штрафа, впрочем, как и позитивные (якобы предотвращенный гол) мы учтем введением числового коэффициента.

Свободное время

Вычтя из всех игр время, затраченное на шайбы, пасы и штрафы мы получим еще некоторое "свободное" время «T», которое определяется формулой:

T = M - G/Gm - A/Am - P/Pm

Здесь М, G, A, P – матчи, голы, передачи и штрафы данного игрока.

Gm, Am, Pm – максимальная результативность игроков в данном виде спорта за данный промежуток времени (сезон, десятилетие или вся история)

Может так получится, что максимальные показатели, которые мы определяем по разным игрокам, недостаточно велики, и данный игрок просто не имеет «свободного времени». Более того, у какого-то игрока это время вообще может быть отрицательным. Это говорит только об одном – мы должны несколько «улучшить» наши представления об идеальном игроке или попросту увеличить эти показатели. Выше мы говорили о том, что максимальная результативность не догма, а ориентир. А максимальные показатели результативности – свободные параметры модели.

Фиксируемые действия

Все фиксируемые действия определим, как сумму голов, пасов, штрафов, получив величину R. Ну, точно так же как в известной системе оценки атакующих игроков ГОЛ + ПАС. Только мы же понимаем, что вес (значимость) этих событий не одинакова. Поэтому суммировать будем с коэффициентами.

R = a * G + b * A + c * P

Здесь a b c - просто коэффициенты, которые мы сейчас не знаем, но попытаемся определить позже. При этом для определенности возьмем заброшенные шайбы за единицу измерения результата. То есть коэффициент «а» = 1. Этим мы задали и размерность величины R, выразив ее в шайбах. Таким образом, даже если защитник и вообще никогда не забрасывал шайб, мы можем оценить его действия в шайбах.

Отметим, что это дань традиции и нашего внимания к атакующим действиям. С таким же успехом мы могли бы оценивать действия игроков «штрафами», имея ввиду их положительную, оборонительную сущность. Но это было бы уж слишком…

Скрытые действия

Исходя из «презумпции невиновности» игрока, мы полагаем, что все свободное время игрок проводит на площадке с пользой для команды. Просто его действия пока не фиксируются статистиками. Возможно это количество рассказанных им анекдотов или похлопываний по спине. А возможно это вообще невозможно (извините за каламбур) зафиксировать в числовой форме.

Так или иначе, мы должны свободное время оценить, как мы приняли, “в шайбах”. Обозначим эту величину буквой I, от английского слова «image» (мнимый). Этим мы подчеркнем мнимый, воображаемый характер данной величины. Итак

I = d * FT

d – как и другие коэффициенты - b c еще предстоит определить. Напомню, коэффициент a мы уже определили, положив его равным единице.

Результат

Остается только сложить величины, характеризующие реальные и мнимые действия. В итоге мы получим величину результат

Результат = I + R

Результат = G + b * A + c * P + d * T

Наконец подставив формцлу для Т получим общий вид для формулы, связывающей Результат, характеризующии игрока с его индивидуальными показателями и показателями той общности игроков к которой он принадлежит.

Результат = G + b * A + c * P + d * (M - G/Gm - A/Am - P/Pm)

Можно упростить эту формулу, однако мы не будем этого делать, чтобы сохранить содержательный смысл коэффициентов. В этом определенная «физичность» нашего подхода. Упростив выражение, пойдя по «математическому» пути мы получим, три формальных свободных параметра, которым трудно будет придать определенный смысл. А значит, практически невозможно будет объяснять модель спортивным специалистам. Это же приведет к бессмысленности всей затеи создать объективную оценку членов команды.

Успех

Теперь обратимся к Успеху. Напомню это величина, которая характеризует достижения.  Если есть результат, и есть ресурс, то

УСПЕХ = результат * результат / ресурс

Ресурс для нас это число сыгранных матчей - M

Эта величина характеризует «не случайность» результата. Иными словами мы задаем вопрос: А какова достоверность того, что этот результат НЕ СЛУЧАЕН?

Равенство атаки и обороны

И последний этап нашей модели – определение свободных параметров. Для этого мы примем естественную гипотезу, что заслуги игроков атаки перед хоккеем не хуже, и не лучше заслуг игроков обороны. Найдется ли кто-то, кто будет ее оспаривать?

Определим в нашем списке игроков атаки и игроков обороны, составив два ранжированных списка. Первый список расположим по величине бомбардирского успеха.

Успех бомбардира = G * G / M

Второй список составим по величине “штрафного» успеха

«Успех» штрафника – P * P / M

Первый список отберет нам нападающих, второй – защитников. Полагая, что сумма успехоа первых 100 – 200 игроков того и другого списка должны быть одинаковы мы и определим значения всех необходимых коэффициентов

Лучшие в истории НХЛ

Кто глядит на нас с экрана?
Два хоккейных хулигана
Два хоккейных паразита -
Фил и Тони Эспозито.

Итак, мы имеем следующие данные. GP - игры, G - шайбы, A - передачи, PIM - штрафные минут - это стандартная хоккейная статистика, которая велась в НХЛ с 1917 года. Правда, насчет результативных передач в начале хоккейной истории у меня сомнения... Ну что имеем, то и имеем.

Эта таблица построена при следующих значениях коэффициентов

Gm = 2,25 т.е считается, что "идеальный" игрок забивает 2,25 шайб за игру

Am = 4,50 т.е считается, что "идеальный" игрок делает 4,50 результативных передачи за игру

Pmax = 6.00 т.е считается, что "идеальный" игрок зарабатывает 3 штрафа за игру

Rnk
Players
GP
G
A
P
FT
Act
Tot
Succ
1
Hunter_Dale
1593
365
773
4292
544
3146
3690
8546
2
Gretzky_Wayne
1695
1016
2223
643
642
3164
3806
8546
3
Messier_Mark
1916
785
1354
2112
914
2953
3868
7807
4
Williams_Dave
1045
253
295
4421
130
2706
2836
7697
5
Tocchet_Rick
1289
492
572
3441
370
2682
3052
7227
6
Howe_Gordie
1924
869
1131
1905
969
2751
3720
7191
7
Coffey_Paul
1603
455
1272
2064
774
2532
3306
6818
8
Verbeek_Pat
1541
548
577
3130
648
2587
3235
6789
9
Stevens_Scott
1830
219
795
3165
1029
2455
3483
6629
10
Chelios_Chris
1540
206
823
3023
762
2394
3155
6465
11
McSorley_Marty