Почему «среднее арифметическое» может искажать ваши прогнозы.

Автор: & Рубрика: .

«Среднее», «мода» и «медиана»- важные понятия для беттинга


Наиболее распространенным способом оценки информации в целях прогнозирования спортивных событий является использование «средней», но насколько это эффективно? И полезно ли вообще? Показатели «мода» и «медиана» чаще дают наиболее подходящую информацию, и понять их значения является критически важным для успешного беттинга.

«Среднее» — проблема беттеров.

Из за простоты расчетов «среднего арифметического» многие беттеры используют именно этот показатель когда делают статистический анализ команды. Но все ли знают об ограничениях этого показателя?

Например, анализируя рынок «всего голов», игрок рассчитывает среднее значение голов забитых командой, основываясь на данных прошлых матчей и полагает, что полученное значение даст верный прогноз на количество голов в предстоящем матче. Целесообразно ли так поступать?

Хотя «среднее» дает общую картину,однако оно не учитывает распределения вероятностей внутри анализируемых данных.

В качестве примера давайте посмотрим на количество голов забитых в Премьер-Лиге и  сравним с  Чемпионатом Испании 2013/14 сезона. Среднее количество голов на матч для этих чемпионатов 2.77 и 2.75 соответственно. Это может навести беттера на мысль что, «меньше 2,5 гола» наиболее часто случается в матчах Чемпионата Испании. Тем не менее, это не тот случай. На самом деле 48.4% матчей Премьер Лиги закончились с результатом меньше 2.5 гола, в то время как в чемпионате Испании так закончились только 47.3% матчей.

График представленный ниже демонстрирует как забивались голы в обоих чемпионатах.

В Премьер-Лиге большинство матчей завершились с 2 голами, а в Чемпионате Испании большинство матчей завершились с 3-мя. Среднее значение голов, о котором мы упомянули ранее, скрыло этот факт. О чем же это говорит? О том что «среднее» не учитывает внутри себя распределение вероятностей.

Статистика забитых голов а Премьер Лиге и Чемпионате Испании

Еще одна опасность использования «среднего» значения голов, это применение такого расчёта к матчам отборочных турниров и в частности к командам, которые можно назвать «мальчиками для битья». Почему это плохо? Потому что в таких матчах случаются разгромные поражения таких команд, что влияет на общее количество голов. Эти матчи с разгромными счетами существенно искажают общую картину и приводят беттера к заблуждению и переоценке реальной ситуации.

Ниже мы исследуем альтернативы для «средней». Этими альтернативами являются «мода» и «медиана».

Мы используем три числовых ряда чтобы показать два сценария в которых «среднее» не дает адекватной оценки.

В ниже представленных числовых рядах среднее значение равно 5:

  •        Ряд A: 4, 5, 5, 5, 6
  •        Ряд B: 3, 4, 4, 4, 10
  •        Ряд C: 3, 4, 5, 6, 7

 Сценарий первый: нормальное распределение

Хотя все три ряда дают в сумме 25 и имеют одинаковое «среднее», распределение внутри них отличается.

Ряд A можно классифицировать как нормально распределенный, в начале и в конце ряда  находится по одному числу отличному от среднего.

Использование среднего арифметического  идеально подходит для таких случаев, то есть случаев нормального распределения, когда значение среднего находится в середине  множества значений, а по краям переменные меняются с одинаковой частотой.

Напротив, в ряду B, 4 числа ниже среднего значения и только одно число выше. Это  можно описать как неравномерное распределение.

Понимая ограниченные возможности использования среднего арифметического, беттерам полезней судить об уместности применения этого критерия для прогнозирования

При использовании большого количества данных, беттерам целесообразней попробовать использовать другие критерии, такие как мода и медиана.

Медиана— это значение в середине распределения находящегося в возрастающей или ниспадающей стадии

Для рядов A и B это 5 и 4 соответственно.

Мода – это наиболее часто встречающееся значение, которое здесь также равно 5 и 4 соответственно.

Нормальное распределение должно иметь арифметически равные среднее арифметическое, моду и медиану. Разница между двумя последними и среднем арифметическим видна в ряду B, что говорит о том, что это неравномерное распределение, и средняя тут- не идеальный показатель.

Сценарий второй: неравномерное распределение

Два ряда могут быть симметрично, но неравномерно распределены. Например, так же как и в ряду A, в ряду С имеется нормальное распределение, потому что значения по обе стороны от среднего (5) отличны от него на равную величину.

Несмотря на то, что среднее для обоих рядов это 5, все же этот критерий более подходит для ряда A из-за того что другие числа из ряда не сильно отличаются от среднего значения. Разница между этими рядами в дисперсии чисел внутри них. Поэтому нам нужно вычислить дисперсию.

Чтобы это сделать, беттер должен вычислить диапазон и стандартное отклонение.

Диапазон — это разница между минимальным и максимальным значением. Вычислить легко.

Стандартное отклонение вычислить немного сложнее. В применении к данной статье это будет варьирование чисел ряда  по отношению к среднему числу. Пожалуйста, обратите внимание, что мы опубликуем статью, в которой рассмотрим стандартное отклонение более детально.

Ряды A и С имеют диапазоны 2 и 4 соответственно, и имеют стандартное отклонение 0,71 и 1,58 соответственно. Так как обе величины больше в ряду С, это является подтверждением того, что в этом ряду больше различий внутри.

Заключение

Понимая ограниченные возможности использования средней, беттерам полезней  судить об уместности применения этого критерия для прогнозирования. При сомнении в адекватности применения среднего арифметического в анализах игр, следует применить другие критерии рассмотренные  в этой статье.

создай-аккаунт