Помните осьминога Пола? А кампанию по защите животных, развернутую неравнодушными гражданами, против его содержания в баре и эксплуатации для предсказания итогов футбольных матчей? Даже если ему там жилось неплохо, то все равно его прогнозы не были основаны на анализе ситуации, в отличие от тех, которые предложили в этом году специально к Чемпионату мира по футболу 2018 в России.
На этот раз предсказывать итог матчей будет специально обученная нейронная сеть.
Специалисты Технического университета Дортмунда и Гентского университета создали и обучили нейронную сеть, способную предсказывать результаты матчей ЧМ по футболу 2018 в России.
Методы машинного обучения, используемые для обучения нейросети, под названием «random forest», основывались на сравнении 3 разных моделей:
- Poisson regression — Пуассоновская регрессия — используется для распределения команд в топ-листе, исходя из истории побед и поражений, преимущественно последних матчей;
- Ranking forests — метод случайных лесов — используется для прогнозирования сильнейших игроков сезона;
- Ranking methods — метод ранжирования — используется для определения ведущих команд;
Какие показатели использовались для определения вероятных исходов матчей?
Для начала была создана база данных, включающая названия команд и их результативность на последних значимых матчах, а также 5 факторов, которые по мнению ученых могут влиять на успешный исход игры для каждой из них:
- Состав команды
В этой категории учитывались следующие показатели: максимальное число игроков одного клуба в сборной, их средний возраст, наличие и количество иностранных игроков, наличие и количество игроков, играющих в лиге чемпионов;
- Тренер команды
В этой категории учитывались следующие показатели: возраст, стаж, национальность;
- Спортивный фактор
В этой категории учитывались следующие показатели: наличие и количество букмекерских ставок из центрального агентства ставок в Германии, ранг по системе FIFA;
- Экономический фактор
В этой категории учитывались следующие показатели: ВВП на душу населения в момент проведения ЧМ, численность населения страны;
- Вероятность преимущества при игре на домашней площадке
В этой категории учитывались следующие показатели: является ли команда принимающей стороной, играет ли команда на своем континенте, и конфедерация команды;
Как определяли вероятный исход матчей?
Перечисленные выше 5 групп факторов представим в виде переменных 5 типов, а количество забитых голов как переменную ответной реакции. Так, нейронная сеть будет использовать 16 переменных для моделирования хода игры и определения ее вероятного исхода. Подробнее о сути метода «случайного леса» мы расскажем чуть позже.
Каков результат прогнозирования победителя ЧМ по футболу 2018 в России с помощью нейросети?
В «финал прогнозирования» вышли 3 страны (и наверняка Вас это не удивит): Испания, Бразилия и Германия. Причем Германия является действующим чемпионом мира по футболу, у Испании в преддверии начала ЧМ был уволен тренер. Следовательно, в финале по прогнозу нейронной сети встретятся Бразилия и Германия, и победа будет за последними с вероятностью в 64%.
В целом прогноз можно представить следующим образом:
Прогноз до учета увольнения тренера команды Испании
Прогноз после учета увольнения тренера команды Испании — одного из фаворитов «по мнению» нейросети
Нам остается только следить за ходом Чемпионата мира и сравнивать результаты с предсказанием нейронной сети.