No Image

Чем отличается медиана от среднего арифметического

СОДЕРЖАНИЕ
1 просмотров
11 марта 2020

Медиа́на (от лат. mediāna — середина) в математической статистике — число, характеризующее выборку (например, набор чисел). Если все элементы выборки различны, то медиана — это такое число выборки, что ровно половина из элементов выборки больше него, а другая половина меньше него. В более общем случае медиану можно найти, упорядочив элементы выборки по возрастанию или убыванию и взяв средний элемент. Например, выборка <11, 9, 3, 5, 5>после упорядочивания превращается в <3, 5, 5, 9, 11>и её медианой является число 5. Если в выборке чётное число элементов, медиана может быть не определена однозначно: для числовых данных чаще всего используют полусумму двух соседних значений (то есть медиану набора <1, 3, 5, 7>принимают равной 4), подробнее см. ниже.

Также медиану можно определить для случайных величин: в этом случае она делит пополам распределение. Грубо говоря, медианой случайной величины является такое число, что вероятность получить значение случайной величины справа от него равна вероятности получить значение слева от него (и они обе равны 1/2); более точное определение см. ниже.

Можно также сказать, что медиана является 50-м персентилем, 0,5-квантилем или вторым квартилем выборки или распределения.

Содержание

Свойства медианы для случайных величин [ править | править код ]

Если распределение непрерывно, то медиана является одним из решений уравнения

F ( x ) = 0.5 <displaystyle F(x)=0.5>

Если распределение является непрерывной строго возрастающей функцией, то решение уравнения однозначно. Если распределение имеет разрывы, то медиана может совпадать с минимальным или максимальным (крайним) возможным значением случайной величины, что противоречит «геометрическому» пониманию этого термина.

Медиана является важной характеристикой распределения случайной величины и, так же как математическое ожидание, может быть использована для центрирования распределения. Поскольку оценки медианы более робастны, её оценивание может быть более предпочтительным для распределений с т. н. тяжёлыми хвостами. Однако о преимуществах оценивания медианы по сравнению с математическим ожиданием можно говорить только в случае, если эти характеристики у распределения совпадают, в частности, для симметричных функций плотности распределения вероятностей.

Медиана определяется для всех распределений, а в случае неоднозначности, естественным образом доопределяется, в то время как математическое ожидание может быть не определено (например, у распределения Коши).

Пример использования [ править | править код ]

Предположим, что в одной комнате оказалось 19 бедняков и один миллионер. У каждого бедняка есть 5 ₽, а у миллионера — 1 млн ₽ (10 6 ). В сумме получается 1 000 095 ₽. Если мы разделим деньги равными долями на 20 человек, то получим 50 004,75 ₽. Это будет среднее арифметическое значение суммы денег, которая была у всех 20 человек в этой комнате.

Читайте также:  Сброс настроек word 2016

Медиана в этом случае будет равна 5 ₽ (полусумма десятого и одиннадцатого, срединных значений ранжированного ряда). Можно интерпретировать это следующим образом. Разделив всю компанию на две равные группы по 10 человек, мы можем утверждать, что в первой группе у каждого не больше 5 ₽, во второй же не меньше 5 ₽. В общем случае можно сказать, что медиана это то, сколько принёс с собой «средний» человек. Наоборот, среднее арифметическое — неподходящая характеристика, так как оно значительно превышает сумму наличных, имеющуюся у среднего человека.

Неуникальность значения [ править | править код ]

Если имеется чётное количество случаев и два средних значения различаются, то медианой, по определению, может служить любое число между ними (например, в выборке <1, 3, 5, 7>медианой может служить любое число из интервала (3,5)). На практике в этом случае чаще всего используют среднее арифметическое двух средних значений (в примере выше это число (3+5)/2=4). Для выборок с чётным числом элементов можно также ввести понятие «нижней медианы» (элемент с номером n/2 в упорядоченном ряду из n <displaystyle n> элементов; в примере выше это число 3) и «верхней медианы» (элемент с номером (n+2)/2; в примере выше это число 5) [1] . Эти понятия определены не только для числовых данных, но и для любой порядковой шкалы.

Сравнение погрешностей приборов критерием Манна-Уитни на сервисе Статзиллы показало, что средний уровень погрешностей двух приборов статистически значимо различается (уровень статистической значимости р=0,02). При этом, среднее арифметическое ошибки прибора А равно 14,6 мм.рт.ст., но и у прибора Б оно также составило 14,6 мм.рт.ст…Какой из приборов статистически лучше?

Ниже приведены результаты расчета значимости различий по Манну-Уитни:

Во-вторых, медиана оценивает среднее, нивелировав влияние выбросов. Но именно эта «сдержанность» медианы может скрыть из виду важные моменты, тогда как среднее арифметическое, завысив или занизив среднее, поможет обратить на них внимание. Так, в нашем примере 2 с погрешностью прибора, медиана говорит, что прибор Б измеряет давление в среднем точнее. Но высокое среднее арифметическое и сами данные указывают на внушительные выбросы – 30 и 90 мм.рт.ст. Очень важно разобраться с ними и понять, чем вызваны такие аномально высокие ошибки измерений.

Читайте также:  Asus zenfone 3 zoom ze553kl 64gb black

В-третьих, что бы вы ни решили использовать, обязательно укажите, насколько эта оценка среднего уровня устойчива. Для этого можно использовать различные показатели: корень из дисперсии, ошибку среднего, квартили, минимум и максимум, доверительный интервал. Только совокупность описательных статистик даст полную картину о рассматриваемом показателе и позволит избежать нелепых ошибок, неверных выводов, страшных вопросов на защите и насмешек коллег 🙂

Для подведения статистики применяется множество формул, определений и терминов. Они позволяют точно оценить большой объем данных, например, доходы и расходы предприятий за длительный период времени. В статистике наиболее часто используются понятия среднее арифметическое значение и медиана. Эти 2 определения чаще всего применяются вместе, чтобы выводы были более точными. Однако в общественных структурах чаще используется только среднее арифметическое.

Медиана

Этот термин используется в математике (геометрии), статистике, экономике, политике и других сферах деятельности. В статистических отсчетах определение характеризует набор множеств (специалисты часто называют его выборкой). Это данные, состоящие из множества неравных чисел.

Медиана — это одно множество, стоящее в середине. Она делит всю последовательность на 2 одинаковые части:

  1. Данные, меньшие значения.
  2. Данные, большие значения.

Все множества сортируются по возрастанию. Точное значение вычисляется при нечетном количестве элементов совокупности.

Если последовательность состоит из четного количества значений, переменная может быть определена неоднозначно. В таком случае суммируют 2 соседних числа, и делят сумму на 2.

Главные свойства характеристики:

  • Не зависит от элементов, расположенных справа и слева от нее.
  • При объединении нескольких последовательностей (с известными размерностями), невозможно сразу определить итоговую характеристику.
  • Минимальное отличие от абсолютных отклонений, по сравнению с другими статистическими терминами.
  • Чем меньше отклонения у чисел совокупности, тем ближе они к значению термина.

Среднее арифметическое

Эта размерность является основной в математике (алгебре) и статистике. Она вычисляется по формуле: сумма всех элементов последовательности, деленная на количество.

Определение используют для обработки сведений за большой период времени. Оно применимо для политической, экономической и социальной сфер. Ее часто используют, как показатель нескольких вычислений или сбора данных.

Многие статисты считают его неэффективным, так как множество лучше применяется для меньшей последовательности. Оно не показывает максимум и минимум, если они кардинально отличаются, а совокупность данных большая. К другим недостаткам характеристики относятся:

  1. Подвергается влиянию чрезмерных отклонений (если данные отличаются на большие числа).
  2. Показывает неправильные данные при измерении сведений циклических переменных (вычисление угла наклона или фазы события).
  3. Плохо применяется к вычислению процентных величин (подсчет инвестиций).
Читайте также:  Хочу создать музыкальную группу

Общая характеристика

Оба статистических термина применяются для обработки данных, выявления статистики и подведения итогов. В частных случаях данные переменные могут иметь равные значения.

Терминами пользуются в разных научных сферах, например в математике. Среднее арифметическое имеет в алгебре и статистике одинаковые определение и формулы. Медиана в математике применяется в геометрии — это отрезок, проведенный из угла треугольника к противолежащей этому углу стороне, и делящий сторону на 2 равных отрезка.

Для подробной статистики используются одновременно оба термина, вместе с другими переменными (мода, частота, выбросы и пр.). Это позволяет более точно оценить собранные данные о подсчетах доходов и расходов, измерениях температуры, объема воды и др.

Если все числа совокупности равны, то числа переменных будут равными и равны всем элементам последовательности.

Отличия определений

Формулировка и определение

Медиана делит последовательность пополам, причем 1 часть состоит из элементов, меньших этой величины, а 2 часть состоит из больших чисел. Среднее арифметическое — это сумма всех элементов, деленная на их количество.

Данные в некоторых случаях совпадают, однако чаще всего они имеют разные значения.

Точность вычислений

Среднее арифметическое дает неточный итог подведения статистики, особенно если данных слишком много. Некоторые статисты заменяют его модой — элемент, который чаще всего встречается в последовательности. В частных случаях необходимо использовать среднее геометрическое, так как арифметическое дает неточный результат. Оценить эффективность величины можно только после применения его на практике, изучения всех значений последовательности и вычисления других статистических характеристик.

Медиана является более точной величиной, чем другое множество.

Однако для эффективной статистики необходимо учитывать сразу несколько показателей.

Применение

Для большинства обывателей медиана — это не статистическая величина, а математическая. Она чаще применяется в геометрических задачах на треугольники, как отрезок или луч. Многие даже не знают, что данное определение применимо к статистике. Его используют только при специализированных отчетах, для подведения итога. В устных докладах переменную не озвучивают, однако в документации ее необходимо описывать.

Среднее арифметическое также применяется в математике, однако в статистике оно известно не меньше. Его часто используют в СМИ, политике и экономике. Эта переменная изучается на начальной стадии обучения статистике.

Для большинства обывателей среднее арифметическое — более понятная величина, несмотря на то, что она неточна во многих случаях.

Комментировать
1 просмотров
Комментариев нет, будьте первым кто его оставит

Это интересно
No Image Компьютеры
0 комментариев
No Image Компьютеры
0 комментариев
No Image Компьютеры
0 комментариев
No Image Компьютеры
0 комментариев
Adblock detector