Некоторые пояснения к программной настройке Football rating V1

Настройка рассчитана для работы в составе Microsoft Excel.

При помощи Football rating V1 (по состоянию на 16.01.2009 г.) можно рассчитать следующие рейтинги:
  • Эло-рейтинг (интегральный и мгновенный)
  • P-рейтинг (интегральный и мгновенный)
  • Взвешенные очки и рейтинг ВО-75 (две версии рейтинга, расчитанные по потенциалу противника в виде, близком к обычном набранным командами очкам)
  • Рейтинг виртуального взвешивания ВР (турнирный потенциал)
  • ВР-рейтинг бескомпромиссности
  • Е-рейтинг силы (оценка способности отбирать очки)
  • Е-рейтинг слабости (оценка склонности к потерям очков)
  • Е-рейтинг побед (не учитываются ничейные исходы)
  • Е-рейтинг поражений (не учитываются ничейные исходы)
  • F-рейтинг забитых мячей (потенциал атаки)
  • A-рейтинг пропущенных мячей (потенциал обороны)
  • DIF-рейтинг разницы забитых и пропущенных мячей (убедительность превосходства
  • FR-рейтинг отношения забитых к пропущенным мячам


Модуль Football rating V1 "заточен" на расчет рейтингов команд, участвующих в замкнутом турнире. Когда я программировал, то думал о футбольных турнирах, и любителях анализировать футбольные турниры. Хотя, конечно, область применения может оказаться и шире. В модуле нет особых проверок на "дураков" и "разумных" ограничений.
Это - не коммерческий продукт. Денег на этом я не зарабатываю. Считайте, что это подарок тем нескольким десяткам (не думаю, что таких людей может быть больше сотни) любителей цифры, разбросанных по территории бывшего СССР.
Возможно, что программа "сыровата", да и ошибки содержит. Но дареному коню, как известно ... Главное, чтоб конь не имел отношения к данайскому.
Ряд рейтингов я еще не реализовал - мне очень не хватает времени. Мое увлечение имеет практически исключительно "ночную" прописку.
И еще. Заранее предостерегаю Вас от необдуманных применений Football rating V1. Помните, что Ваши тормоза - в Ваших собственных руках.
Например.
Вы решите подсчитать, какая же из команд Английской лиги "самая-самая". Вы сводите в одну таблицу все встречи всех команд за какой-нибудь длительный период, и считаем интегральный Эло (Е-рейтинг и т.п.).
Программа ничем Вас не ограничивает.
Без всяких расчетов смело могу предположить, что в числе лидеров мы увидим Ливерпуль, Арсенал, Манчестер Юнайтед. Возможно Лидс и даже Ноттингем Форест. Или Челси, но это - врядли. Буду крайне удивлен другому результату.
Но дальше Вы обязательно с удивлением или восторгом обнаружите затесавшуюся команду (или несколько затесавшихся), названия которых известны только экспертам.
А ответ очень прост. Просто открытый турнир требует других подходов.
Затесавшийся малоизвестный середнячок - это просто команда, сыгравшая пару-тройку сезонов в лиге сильнейших и навсегда его покинувшая. И этот малоизвестный середнячок провел на удивление удачные игры против названных выше лидеров. Вот и все. То ли сезон для лидеров был неудачен, то ли команда была зубаста на своем поле. Не знаю.
Возможно, вышеописанную ситуацию не удастся обнаружить в чемпионате Англии. Но она очень вероятна. И ее точно удастся найти в чемпионате Франции, Германии или СССР.
Поэтому предостерегаю - думайте, что Вы делаете, и осторожно интерпретируйте результаты.
И тогда Вы получите нормальный инструмент для анализа.

И еще. Лучшая атака не всегда сильнее лучшей обороны. Нужен баланс между ними.
Пока что нет "лучшего" и "объективного" рейтинга. Его еще не придумали. Каждый рейтинг имеет свою теорию, свой подход. А потому и дает свой ответ на один и тот же вопрос.
Впрочем, велика вероятность, что на Ваш вопрос ответа нет. И лучший инструмент - интуиция.
Удачи.


***

"Шахматный" Эло-рейтинг

В основе Эло-рейтинга лежат статистические зависимости и гипотеза Эло, который предположил, что соотношение побед и поражений находится в степенной зависимости от разности в рейтингов соперников.
Эло-рейтинг относится к рейтингам, зависящим от исхода встречи соперников. Вероятно ЭЛО - это наиболее разработанный и применяемый рейтинг.
Вычисляется вероятность выигрыша команды A против команды B. Эта вероятность одновременно равна наиболее вероятному количеству очков, которое наберёт команда A в игре с B:

EA=1/(1+10**(RB-RA)/400)
где:
** - знак возведения в степень;
EA - ожидаемое количество очков, которое наберёт команда A в игре с командой B (вероятность выигрыша команды A);
RA - рейтинг команды A;
RB - рейтинг команды B.
Вероятность победы команды A в процентах будет равна EA * 100%.
Новый рейтинг команды A рассчитывается по формуле:
RA новый =RA+K(SA-EA)
где:
K - коэффициент (в программе называется цена встречи команды), значение которого по умолчанию равно 25
SA - фактически набранное игроком A количество очков (1 очко за победу, 0,5 - за ничью и 0 - за поражение);
RA новый - новый рейтинг команды A.
Аналогично вычисляется и рейтинг RB новый команды B
Начальный рейтинг команд по умолчанию составляет 1000 единиц.
Начальная турнирная сила команды - величина неопределенная. Программа позволяет применять итерационный процесс для поиска истинной начальной силы команды. Процесс обычно устанавливается при числе итераций 20-100.
В результате расчета программы получается массив дискретных значений величины Эло-рейтинга для каждой команды по итогам проведенных встреч.
Я называю их мгновенными значениями рейтинга. Турнирная сила команды - это площадь, ограниченная кривой изменения ЭЛО-рейтинга по турам.
Для вычисления истинного, а не дискретного Эло-рейтинга применяется численное интегрирование. Полученный в результате расчета рейтинг естественно назвать интегральным рейтингом Эло.
Для приведения величины интегрального Эло-рейтинга к привычной величине дискретного (мгновенного) Эло-рейтинга программа вычисляет "приведенный интегральный Эло-рейтинг", по которому можно оценить турнирную силу команды.
В принципе Эло-рейтинг зависит от последовательности встреч соперников. Итерационный процесс должен сглаживать это свойство рейтинга, но детальных исследований автор не проводил.


***

Р-рейтинг (народный рейтинг)

Р-рейтинг отношу к Эло-подобным рейтингам. Р-рейтинг был придуман Евгением Потемкиным (подробности - на сайте автора).

Основная идея - команды участники делятся друг с другом частью своего рейтинга в зависимости от исхода встречи.
Устанавливается начальный рейтинг (в программном модуле по умолчанию это 1000).
Победитель забирает у побежденного % его рейтинга. В программном модуле эта величина называется "цена встречи команд", и по умолчанию составляет 10%).
Для вычисления истинной турнирной силы команды применяется итерации, интегрирование и приведение интегрального рейтинга к привычной величине мгновенного (дискретного) рейтинга.


***

Взвешивание очков (ВО-75 рейтинг)

Применяется принцип, который я называю взвешивание очков. Он очень прост. Оценка силы команды производится не по набранным очкам, а по показателям соперников.
Итак рейтинг "взвешенные очки" (версия 1) вычисляется так
Rt= Очков побежденные + ½* Очков ничьи

 

Эту сумму я называю ВО оценкой.
Найдем коэффициент привидения
K=( ∑ всех очков чемпионата)/( ∑ ВО оценки набранных очков чемпионата)

 

Собственно RtВзвешенные очки находятся делением ВО оценки набранных очков каждой команды на коэффициент привидения K.
RtВзвешенные очкиi=( ∑ ВО оценкиi) / K
Если теперь для следующего шага вычисления ВО оценки использовать вновь рассчитанные взвешенные очки и устроить итерации, то значение рейтинга можно уточнить. (процесс сходится при числе итераций около 12-ти.)
ВО-75 рейтинг – это оценка близости команды к чемпионскому 75 % рубежу набранных очков (вернее взвешенных).
Идея "взвешенных очков" (способ 2) такова. Суммирование происходит не очков команд, у которых выиграли, а подсчитываются очки команд, у которых выиграла команда, у которой мы выиграли.
Если командаа А победила команду В, то мы суммируем все очки команд, у которых команда В выиграл и добавляем половину всех очков команд, с которыми команда В сыграл в ничью.
Подобную операцию производим и с командами, с которыми команда В сыграла в ничью, только уменьшаем сумму в 2 раза.
Результат, полученный по способу 2 получается абсолютно идентичный способу 1, только количество вычислений на каждом шаге по сравнению со способом 1 возрастает значительно, однако итерации сходятся очень быстро.

***

ВР-рейтинг (рейтинг виртуального взвешивания)

ВР-рейтинг - это рейтинг, зависящий от исходов встреч соперников.
Давайте представим себе некий вид рыночных весов для взвешивания рейтингов.
На левую тарелку весов мы после каждой встречи фигурально будем складывать условную гирьку рейтинга команды (на гирьке пока написан вопросительный знак, числа нет). На правую тарелку весов будем фигурально ставить условную гирьку противовеса (весом в условный килограммо-рейтинг, или просто весом в условную единицу). Количество рейтинговых гирек =количеству гирек противовесов= количеству игр, проведенных командой.
Дальше мы начали играть турнир. Каждая встреча, закончившаяся победой рассматриваемой команды, приводит к росту её рейтинга. Рост происходит посредством помещения рейтинга проигравшей команды на правую чашу весов.
Каждая встреча, закончившаяся поражением рассматриваемой команды, приводит к снижению её рейтинга. Снижение происходит посредством помещения рейтинга выигравшей команды на левую чашу весов. Ничья приводит к одновременному размещению половинки рейтинга соперника и на левой и на правой чаше весов.
Теперь вы должны представить, что весы не одни. Их ровно столько, сколько , сколько команд, участвующих в соревнованиях.
Мы пришли к системе линейных из N уравнений следующего вида:

Система Уравнений ВР-рейтинга
где
b – коэффициент, равный количеству игр, проведенных i-й командой;
a – коэффициент встреч a= количество побед минус количество поражений во взаимных встречах 2-х команд;
C – свободный член (те самые весовые гирьки, которые мы укладывали на правую чашу весов). В программе C= количеству игр, проведенных i-й командой умноженный на коэффициент базового смещения (по умолчанию =100);
Xi рейтинг i-й команды.

Нельзя не отметить, что ВР-рейтинг команды изменяется ("меряется") при помощи рейтингов команд-соперников. В силу своего построения ничьи не привносят ни плюса, ни минуса - они влияют на рейтинг только через количество игр.
Поэтому я назвал этот рейтинг "рейтингом виртуального взвешивания". По своей сути он очень близок рейтингу "выровненных очков" и легко может в "выровненные очки" преобразован.
Рейтинг начинает "считаться" уже с первого тура. Правда, до "хорошего" заполнения матрицы результатов, это больше похоже на рейтинг парных встреч.
Иными словами - на начальном этапе турнира при малом количестве встреч рейтинг дает весьма приближенный результат.

ВР-рейтинг бескомпромиссности

 

ВР-рейтинг бескомпромиссности отличается от обычного ВР-рейтинга тем, что при расчете коэффициента b игры, окончившиеся в ничью не учитываются.

***

Семейство относительных Е-рейтинги Потемкина

 

В основе рейтингов Евгения Потемкина лежит следующее представление.
Умозрительно представим себе детские качели.
В процессе прохождения турнира для выяснения рейтинга команды мы будем поступать следующим способом.
Выиграли у команды - положили весь рейтинг этой команды на правую часть качели на условном расстоянии в 1 метр.
Сыграли в ничью - положили половину рейтинга этой команды на правую часть качели на условном расстоянии в 0,5 метра.
Проиграли команде - положили свой рейтинг на левую часть качели на условном расстоянии в 1 метр.
Сыграли в ничью - положили половину своего рейтинга на левой части качели на условном расстоянии в 0,5 метра.
Мы приходим к системе линейных уравнений следующего вида:

Система Уравнений Е-рейтинга
где
b – коэффициент уловных потерь, ), b=Количествопоражений+0,5*Количествоничьих;
a – коэффициент условных приобретений, a= Количествопобед+0,5*Количествоничьих (во взаимных встречах 2-х команд);
Xi рейтинг i-й команды.
Для того, чтобы систему можно было решить, последнее уравнение (n-е уравнение) заменено на некоторое начальное условие, позволяющее решить систему.
Коэффициент 100 - в программе носит название начального (базового) рейтинга одной команды.
В приведенной интерпретации Е-рейтинг носит название рейтинга силы. Я, впрочем, считаю такое название неверным.
Мне представляется, что данный рейтинг должен носить иное название. Например - рейтинг относительной силы.
Если мы разделим левую и правую части уравнений на коэффициенты b, то вы поймете, о чем я говорю.
Рейтинг представляет собой сумму рейтингов команд (умноженных на коэффициенты условных приобретений). Эта сума делится на коэффициент уловных потерь.
Именно поэтому я отношу все подобные рейтинги к семейству относительных. Давайте, сравним ВР-рейтинг и Е-рейтинг силы.
ВР-рейтинг говорит: "тот кран сильнее, который смог поднять за смену на 10-тый этаж больше груза".
Е-рейтинг силы интерпретирует результат так: "тот кран лучше, у которого отношение веса поднятого за смену груза на 10-тый этаж к затраченной электроэнергии наибольшее".
Что-то в этом духе.
Я думаю, что Е-рейтинг силы позволяет говорить о потенциале команды (причем "приведенном, относительном" потенциале), но никак не о турнирной силе команд.
Рейтинг больше подходит для подчеркивания различий между Феррари и Жигулями. Он кардинально раздвинет расстояние между двумя этими автомобилями.
Мне кажется, что это больше критерий относительного успеха, чем рейтинг силы - поскольку он говорит о количестве отобранной командой силы на единицу условных потерь.
Вот.
Не исключаю, что я ошибаюсь.

Е-рейтинг слабости

 

Е-рейтинг слабости построен на аналогичном рейтингу силы уравнении. (Давайте условно называть его Е-уравнение).

где
b – коэффициент уловных приобретений, ), b=Количествопобед+0,5*Количествоничьих;
a – коэффициент условных потерь, a= Количествопоражений+0,5*Количествоничьих (во взаимных встречах 2-х команд);
Xi рейтинг слабости i-й команды.
Для того, чтобы систему можно было решить, естественно последнее уравнение (n-е уравнение) заменено на некоторое начальное условие, позволяющее решить систему.
Естественно было бы предположить, что я считаю этот рейтинг "относительным" критерием слабости (см. выше).
Для того, что бы судить об общем потенциале команды следует отнять от Е-рейтига силы Е-рейтиг слабости. Полученная разница от "относительности" не избавлена.

Е-рейтинги побед и поражений

 

Е-рейтинги побед и поражений базируются на Е-уравнении. При расчете коэффициентов уловных потерь и условных приобретений не учитываются ничьи. Это, так сказать, попытка определить некоторый "относительный" потенциал бескомпромиссности.
Критерий Бескомпромиссность, который может быть представлен как разность Е-рейтингов потерь и поражений.

 


***

Относительные голевые рейтинги

 

Все относительные голевые рейтинги базируются на Е-уравнении. Все они носят такой же "относительный" характер.

 

При расчете Fрейтинга (относительного потенциала атаки) коэффициент b - это пропущенные от соперника мячи, коэффициент a - это мячи, забитые соперникам.

 

При расчете Арейтинга (относительного потенциала обороны) коэффициент b - это забитые соперникам мячи, коэффициент a - это мячи, пропущенные от соперников.

 Можно оченить общий потенциал атака-оборона по следующей сжеме

Относительный баланс атака/оборона = (Fрейтинг - Арейтинг).

 

DIFрейтинг построен на разнице мячей. Ничейные результаты, естественно, игнорируются.
Коэффициент b - это положительная разница мячей при поражениях от соперников, коэффициент a - это разница мячей в случае побед над соперниками.

 

Fracрейтинг построен на отношении забитых к пропущенным мячам. Во избежание деления на ноль используется смещенное отношение (забитые мячи+1)/(пропущенные мячи+1). Ничейные результаты учитываются.
Коэффициент b - это отношение мячей в случае поражений от соперников, коэффициент a - это отношение мячей в случае побед над соперниками.

Обратные от DIFрейтинга и Fracрейтинга я в модуль включать не тороплюсь. Не очень вижу в этом смысл.


 

Убедительно прошу простить за ошибки, описки, неточности и непонятное изложение материала. Но я старался.
Не стреляйте в пианиста. Он играет, как умеет.
В ожидании критики и пожеланий...
16.01.2009 г.
В.Воронцов