На какие цифры следует делать ставки в квадратах Суперкубка?

Мой новый офис познакомил меня с игрой со ставками, с которой я раньше не был знаком: квадратами Суперкубка. Он воспроизводится с сеткой десять на десять, например, с сайта printyourbrackets.com:

Каждая строка и столбец содержат набор цифр от 0 до 9, представляющих счет каждой команды, и каждый участник игры (после внесения денег) добавляет свои инициалы в одно из полей. Затем выбирается победитель по наименьшей значащей цифре в счете. Если (например) игра закончилась тем, что игра была Eagles 20-Patriots 24, игрок, который выбрал строку с 0 и столбец с 4, выиграет.

Если ваша команда устанавливает цифры заранее, вы можете получить статистическое преимущество.Поскольку не все оценки одинаково вероятны, наименее значимые цифры также не одинаковы. Здесь я воспользуюсь подходом, основанным на данных, чтобы найти наиболее распространенные цифры и пары цифр в оценках НФЛ. Как и в большинстве моих сообщений, я буду использовать язык R и набор пакетов tidyverse. К концу сегодняшнего вечера вы можете увидеть, как сбылись мои прогнозы!

Самые распространенные цифры

Мы могли бы использовать только результаты Суперкубка, возможно, взятые из Википедии. В идеальном мире мы могли бы использовать эти данные, поскольку результаты Суперкубка, вероятно, будут немного отличаться от результатов в регулярном сезоне. Но их было всего 51, поэтому данные довольно зашумлены. Вместо этого мы рассмотрим все игры НФЛ с 1978 года, благодаря этому полезному набору данных GitHub от Джеймса Эвери.

Это дает нам набор из более чем 18 000 футбольных матчей (из более чем 9 000 игр), которые мы можем проанализировать скачать мобильное приложение 1win.

Сначала мы могли бы спросить, каковы наиболее распространенные оценки. (Если вы футбольный фанат, вы можете попробовать угадать, прежде чем смотреть на них!)

Самая распространенная (с большим отрывом) - 17. Это может быть результатом двух приземлений (каждое с дополнительным очком или одно с двумя дополнительными очками) и броска с игры. 27 также является обычным явлением, так что 7 как младшая цифра уже выглядит твердой ставкой.

Итак, давайте создадим гистограмму наиболее распространенных конечных цифр. (Я сделаю это в серебре для Орлов).

Как мы и подозревали,самая распространенная цифра - 7 . За ним следует 0, а также довольно часто встречаются 4 и 5. Но выдействительно не хотите ставить на 2 или 5 .

Они независимы?

Вполне вероятно, что стратегия каждой команды влияет на другую (и обе могут зависеть от общих факторов, таких как погода или судья), а это означает, что две цифры в счете не являются статистически независимыми. Итак, давайте рассмотрим наиболее распространенные пары оценок. Для этого графика мы будем использовать красный и белый для Патриотов.

(В играх Суперкубка на самом деле нет домашних и гостевых команд, но это разумный способ визуализировать эти данные).

Интересно, что хотя 7 и 0 сами по себе являются наиболее распространенными цифрами, наиболее распространенными парами цифр являются не пары семерок или пар нулей, а скорее 7-0 и 0-7. В этом есть смысл, потому что, за исключением редких случаев,игры почти никогда не заканчиваются вничью , поскольку в них может быть сверхурочное время. Это означает, что, хотя 17 и 20 являются общими баллами, 17-17 и 20-20 очень редки (на самом деле, в этом наборе данных только по два каждого из них).

Изменение с течением времени

Правила и стратегии меняются со временем, и вполне вероятно, что конечные цифры изменились вместе с ними. Мы можем проверить эту гипотезу с помощью линейного графика.

Не слишком много:относительный порядок 10 цифр оставался неизменным на протяжении каждого десятилетия . Похоже, что 7 стало немного реже, а 0 и 4 в основном сошлись по частоте.

Мы могли бы рассмотреть возможность фильтрации только подмножества данных, например игр с 1990 года. Если учесть слишком много лет, это не будет точно точной картиной современного футбола, но если мы рассмотрим слишком мало данных, у нас не будет достаточно данные и оценка будут зашумленными (это классический пример компромисса смещения и дисперсии). Некоторые сложные модели могут уравновесить эти две проблемы, но этот график показывает, что, вероятно, это не стоит усилий.

Заключение

Я бы сделал ставку на пары7-0 /0-7 или4-7 /7-4 , наиболее распространенные пары цифр. (Хотя шанс выигрыша с каждым из них по-прежнему составляет около 3%, что ненамного выше, чем выигрыш в рулетке). Если бы они были взяты, я бы вообще избегал пар из одинаковых цифр, поскольку отсутствие равных чисел делает их необычно необычными (прошлогодняя игра Суперкубка была первой игрой, когда-либо переходившей в сверхурочное время, и никогда не было равного счета).

В более сложной модели мы бы рассмотрели ставки внутри каждой команды и, возможно, включили бы коэффициенты Вегаса (распределение очков у выигравшей команды отличается от количества очков у проигравшей команды). Я могу попробовать это на Суперкубке LIII в следующем году.

Удачи и приятной игры!

Дэвид Робинсон

Главный специалист по данным в Heap, работает в R и Python.

Электронная почта Twitter Github Stack Overflow

Подписаться

рекомендуемые

  • R Блогеры
  • Блог RStudio
  • R4Stats
  • Просто статистика
  • Аванс

На какие цифры следует делать ставки в квадратах Суперкубка? была опубликована 04 февраля 2018 г.

Популярные слоты

Автор: Елена Казанцева
Дата публикации: 05.27.2021
Рейтинг:
5.5