
Среднее, медиана и мода — чем они различаются и как их считать
Среднее, медиана и мода — самые расхожие статистические показатели.
Все они кратко описывают какое-то центральное значение в наборе данных. Среднее находят через сумму значений, медиана делит выборку на две части, а мода показывает, какой показатель встречается чаще всего.
В материале расскажу, какая между ними разница и как их считать — вручную и в таблицах с помощью функций. Если хотите погрузиться в мир табличек поглубже и структурировать всю свою жизнь, попробуйте курс Учебника.
Среднее
Среднее, а именно среднее арифметическое , равно сумме всех значений в наборе данных, поделенной на количество этих значений.
Среднее показывает, как распределяется сумма значений, если мысленно распределить ее поровну между всей группой.
Есть семь чисел: 14, 9, 12, 8, 7, 10, 13. Найдем среднее. Сначала сложим их — в сумме получится 73. Поделим на количество значений — их семь, и получим, что среднее этого набора равно 10,4.
Когда пригодится. Среднее полезно, когда нужно узнать центральную величину в наборе данных с небольшим размахом. Размах — разница между самым маленьким и самым большим значением в ряду. Например, размах ряда выше: 14 − 7 = 7. Для примера это небольшой размах.
Если размах в данных слишком большой, среднее арифметическое непоказательно: так как мы суммируем значения, большие числа перетянут среднее в свою сторону. В таком случае лучше вычислить медиану, о которой расскажу далее.
Как рассчитать в таблице. В «Экселе» и гугл-таблицах функция расчета называется одинаково — СРЗНАЧ, или AVERAGE. Чтобы получить значение, в свободной ячейке после знака = введите название функции и в скобках укажите диапазон для подсчетов через двоеточие.

Медиана
Медиана — это значение, которое делит числовые данные на две равные части. Тогда перед медианой и после нее будет одинаковое количество значений.
Ее ищут в два действия: сначала упорядочивают данные от меньшего значения к большему или наоборот, а потом определяют значение в центре.
Если в наборе данных нечетное количество значений, медиана будет равна значению посередине. Например, найдем медиану ряда 5, 7, 3, 10, 16, 18, 8. Сначала расставим значения по порядку: 3, 5, 7, 8, 10, 16, 18. В середине стоит 8 — до и после него одинаковое количество значений. Значит, медиана — 8.
Если в наборе данных четное количество значений, медиана будет равна среднему арифметическому двух центральных элементов. Найдем медиану ряда 5, 7, 3, 14, 16, 18, 8, 12. Упорядочим значения: 3, 5, 7, 8, 12, 14, 16, 18. В середине стоят 8 и 12 — до и после них одинаковое количество значений. Сложим их и поделим на 2: (8 + 12) / 2 = 10. Значит, медиана набора данных равна 10.
Когда пригодится. Медиана полезна, когда размах в данных большой — в этом случае самые большие значения не будут сильно влиять на итоговый результат. Ориентироваться на среднее арифметическое будет неверно, потому что оно не будет учитывать маленькие значения.
Как рассчитать в таблице. В «Экселе» и гугл-таблицах функция расчета называется одинаково — МЕДИАНА, или MEDIAN. Чтобы получить значение, в свободной ячейке после знака = введите название функции и в скобках укажите диапазон для подсчетов через двоеточие. Данные сортировать не нужно, таблица сделает это сама.

Мода
Мода — это значение, которое чаще других встречается в наборе данных. Если все значения разные, у выборки нет моды, а если несколько значений повторяются одинаковое количество раз, значит, у выборки несколько мод.
Возьмем ряд 5, 7, 3, 10, 16, 18, 8, 5, 12, 34, 5. Значение 5 повторяется трижды, значит, это мода.
Когда пригодится. Если представить рабочие или учебные задачи, по моде можно определить, какой вариант ответа оказался самым популярным или какой товар покупают чаще других. Моду можно рассчитать не только по числам, но и по словам, хотя такую функцию «Эксель» и гугл-таблицы не поддерживают.
Как рассчитать в таблице. В «Экселе» и гугл-таблицах функция расчета называется по-разному:
- в «Экселе» — МОДА.ОДН, или MODE ;
- в гугл-таблицах — МОДА, или MODE.
Чтобы получить значение, в свободной ячейке после знака = введите название функции и в скобках укажите диапазон для подсчетов через двоеточие.

Новости из мира образования, советы по карьере и учебе, вдохновляющие истории — в нашем телеграм-канале: @t_obrazovanie