Исчисление средней из интервального ряда, относительных величин. Средняя гармоническая, порядок исчисления. Средняя геометрическая. Средняя квадратическая. Например, средняя арифметическая для интервального ряда

Самым распространенным видом средней является средняя арифметическая.

Средняя арифметическая простая

Простая среднеарифметическая величина представляет собой среднее слагаемое, при определении которого общий объем данного признака в данных поровну распределяется между всеми единицами, входящими в данную совокупность. Так, среднегодовая выработка продукции на одного работающего — это такая величина объема продукции, которая приходилась бы на каждого работника, если бы весь объем выпущенной продукции в одинаковой степени распределялся между всеми сотрудниками организации. Среднеарифметическая простая величина исчисляется по формуле:

Простая средняя арифметическая — Равна отношению суммы индивидуальных значений признака к количеству признаков в совокупности

Пример 1. Бригада из 6 рабочих получает в месяц 3 3,2 3,3 3,5 3,8 3,1 тыс.руб.

Найти среднюю заработную плату
Решение: (3 + 3,2 + 3,3 +3,5 + 3,8 + 3,1) / 6 = 3,32 тыс. руб.

Средняя арифметическая взвешенная

Если объем совокупности данных большой и представляет собой ряд распределения, то исчисляется взвешенная среднеарифметическая величина. Так определяют средневзвешенную цену за единицу продукции: общую стоимость продукции (сумму произведений ее количества на цену единицы продукции) делят на суммарное количество продукции.

Представим это в виде следующей формулы:

Взвешенная средняя арифметическая — равна отношению (суммы произведений значения признака к частоте повторения данного признака) к (сумме частот всех признаков).Используется, когда варианты исследуемой совокупности встречаются неодинаковое количество раз.

Пример 2. Найти среднюю заработную плату рабочих цеха за месяц

Средняя заработная плата может быть получена путем деления общей суммы заработной платы на общее число рабочих:

Ответ: 3,35 тыс.руб.

Средняя арифметическая для интервального ряда

При расчете средней арифметической для интервального вариационного ряда сначала определяют среднюю для каждого интервала, как полусумму верхней и нижней границ, а затем — среднюю всего ряда. В случае открытых интервалов значение нижнего или верхнего интервала определяется по величине интервалов, примыкающих к ним.

Средние, вычисляемые из интервальных рядов являются приближенными.

Пример 3 . Определить средний возраст студентов вечернего отделения.

Средние, вычисляемые из интервальных рядов являются приближенными. Степень их приближения зависит от того, в какой мере фактическое распределение единиц совокупности внутри интервала приближается к равномерному.

При расчете средних в качестве весов могут использоваться не только абсолютные, но и относительные величины (частость):

Средняя арифметическая обладает целым рядом свойств, которые более полно раскрывают ее сущность и упрощают расчет:

1. Произведение средней на сумму частот всегда равно сумме произведений вариант на частоты, т.е.

2.Средняя арифметическая суммы варьирующих величин равна сумме средних арифметических этих величин:

3.Алгебраическая сумма отклонений индивидуальных значений признака от средней равна нулю:

4.Сумма квадратов отклонений вариантов от средней меньше, чем сумма квадратов отклонений от любой другой произвольной величины , т.е.

Расчет средней величины в интервальных вариационных рядах немного отличается от расчета в рядах дискретных. Как рассчитать среднюю арифметическую и среднюю гармоническую в дискретных рядах можно посмотреть вот . Такое различие вполне объяснимо – это связано с особенностью , в которых изучаемый признак приведен в интервале от и до.

Итак, посмотрим особенности расчета на примере.

Пример 1. Имеются данные о дневном заработке рабочих предприятия.

Число рабочих, чел.
500-1000 15
1000-1500 30
1500-2000 80
2000-2500 60
2500-3000 25
Итого 210

Начало решения задачи будет аналогичным правилам расчета средней величины, которые можно посмотреть .

Начинаем мы с определения варианты и частоты, поскольку ищем мы средний заработок за день, то варианта это первая колонка, а частота вторая. Данные у нас заданы явным количеством, поэтому расчет проведем по формуле средней арифметической взвешенной (так как данные приведены в табличном виде). Но на этом сходства заканчиваются и появляются новые действия.

Дневной заработок рабочего, руб. х Число рабочих, чел. f
500-1000 15
1000-1500 30
1500-2000 80
2000-2500 60
2500-3000 25
Итого 210

Дело в том, что интервальный рад представляет осредняемую величину в виде интервала. 500-1000, 2000-2500 и так далее. Чтобы решить эту проблему необходимо провести промежуточные действия, и только потом подсчитать среднюю величину по основной формуле.

Что же требуется в данном случае сделать. Все достаточно просто, чтобы провести расчет нам нужно, чтобы варианта была представлена одним числом, а не интервалом. Для получения такого значения находят так называемое ЦЕНТРАЛЬНОЕ ЗНАЧЕНИЕ ИНТЕРВАЛА (или середину интервала). Определяется оно путем сложение верхней и нижней границ интервала и делением на два.

Проведем необходимые расчеты и подставим данные в таблицу.

Дневной заработок рабочего, руб. х Число рабочих, чел. f х’
500-1000 15 750
1000-1500 30 1250
1500-2000 80 1750
2000-2500 60 2250
2500-3000 25 2750
Итого 210

После того как мы рассчитали центральные значения далее проведем расчеты в таблицы и подставим итоговые данные в формулу, аналогично тому как мы уже рассматривали ранее.

Дневной заработок рабочего, руб. х Число рабочих, чел. f х’ x’f
500-1000 15 750 11250
1000-1500 30 1250 37500
1500-2000 80 1750 140000
2000-2500 60 2250 135000
2500-3000 25 2750 68750
Итого ∑f = 210 ∑ x’f = 392500


В итоге получаем, что среднедневная заработная плата одного рабочего составляет 1869 рублей.

Это пример решения, если интервальный ряд представлен со всеми закрытыми интервалами. Но достаточно часто бывает, когда два интервала открытые, первый и последний. В таких ситуациях прямой расчет центрального значения невозможен, но есть два варианта как это сделать.

Пример 2. Имеются данные о продолжительности производственного стажа персонала предприятия. Рассчитать среднюю продолжительность стада одного сотрудника.

Число сотрудников, человек
до 3 19
3-6 21
6-9 15
9-12 10
12 и более 5
Итого 70

В данном случае принцип решения останется точно таким же. Единственно, что поменялось в этой задаче, так это первый и последний интервалы. До 3 лет и 12 лет и более это и есть те самые открытые интервалы. Именно тут возникнет вопрос, а как же найти центральное значение интервала для таких интервалов.

Поступить в этой ситуации можно двумя способами:

  1. Предположить какой бы мог быть интервал, учитывая, что нам приведены интервалы равные, то это вполне возможно. Интервал до 3 мог бы выглядеть как 0-3, и тогда его центральное значение будет (0+3)/2 = 1,5 года. Интервал 12 и более мог бы выглядеть как 12-15, и тогда его центральное значение было бы (12+15)/2 = 13,5 года. Все оставшиеся центральные значения интервала рассчитываются аналогично. В результате получаем следующее.
Длительность производственного стажа, лет х Число сотрудников, человек f х’ x’f
до 3 19 1,5 28,5
3-6 21 4,5 94,5
6-9 15 7,5 112,5
9-12 10 10,5 105,0
12 и более 5 13,5 67,5
Итого ∑f = 70 ∑ x’f = 408,0

Средняя продолжительность стажа 5,83 года.

  1. Принять за центральное значение, то данное которое имеется в интервале, без дополнительных расчетов. В нашем случае в интервале до 3 это будет 3, а в интервале 12 и более это будет 12. Такой способ больше подходит для ситуаций, когда интервалы неравные и предположить какой интервал мог бы быть сложно. Рассчитаем нашу задачу по таким данным далее.
Длительность производственного стажа, лет х Число сотрудников, человек f х’ x’f
до 3 19 3 57,0
3-6 21 4,5 94,5
6-9 15 7,5 112,5
9-12 10 10,5 105,0
12 и более 5 12 60,0
Итого ∑f = 70 ∑ x’f = 429,0

Средняя продолжительность стажа 6,13 года.

Домашнее задание

  1. Рассчитать средний размер посевной площади на одно фермерское хозяйство по следующим данным.
Размер посевной площади, га Количество фермерских хозяйств
0-20 64
20-40 58
40-60 32
60-80 21
80-100 12
Итого 187
  1. Рассчитайте средний возраст работника предприятия по следующим данным
Возраст персонала, лет Число сотрудников, человек
до 18 7
18-25 68
25-40 79
40-55 57
55 и старше 31
Итого 242

Теперь Вы умеете рассчитывать среднюю в интервальном вариационном ряду!

По данным выборочного обследования произведена группировка вкладчиков по размеру вклада в Сбербанке города:

Определите:

1) размах вариации;

2) средний размер вклада;

3) среднее линейное отклонение;

4) дисперсию;

5) среднее квадратическое отклонение;

6) коэффициент вариации вкладов.

Решение:

Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей.

Величина интервала второй группы равна 200, следовательно, и величина первой группы также равна 200. Величина интервала предпоследней группы равна 200, значит и последний интервал будет иметь величину, равную 200.

1) Определим размах вариации как разность между наибольшим и наименьшим значением признака:

Размах вариации размера вклада равен 1000 рублей.

2) Средний размер вклада определим по формуле средней арифметической взвешенной.

Предварительно определим дискретную величину признака в каждом интервале. Для этого по формуле средней арифметической простой найдём середины интервалов.

Среднее значение первого интервала будет равно:

второго - 500 и т. д.

Занесём результаты вычислений в таблицу:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х xf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Итого 400 - 312000

Средний размер вклада в Сбербанке города будет равен 780 рублей:

3) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней:

Порядок расчёта среднего линейонго отклонения в интервальном ряду распределения следующий:

1. Вычисляется средняя арифметическая взвешенная, как показано в п. 2).

2. Определяются абсолютные отклонения вариант от средней:

3. Полученные отклонения умножаются на частоты:

4. Находится сумма взвешенных отклонений без учёта знака:

5. Сумма взвешенных отклонений делится на сумму частот:

Удобно пользоваться таблицей расчётных данных:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Итого 400 - - - 81280

Среднее линейное отклонение размера вклада клиентов Сбербанка составляет 203,2 рубля.

4) Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической.

Расчёт дисперсии в интервальных рядах распределения производится по формуле:

Порядок расчёта дисперсии в этом случае следующий:

1. Определяют среднюю арифметическую взвешенную, как показано в п. 2).

2. Находят отклонения вариант от средней:

3. Возводят в квадрат отклонения каждой варианты от средней:

4. Умножают квадраты отклонений на веса (частоты):

5. Суммируют полученные произведения:

6. Полученная сумма делится на сумму весов (частот):

Расчёты оформим в таблицу:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Итого 400 - - - 23040000

Часто в статистике при анализе какого-либо явления или процесса необходимо учитывать не только информацию о средних уровнях исследуемых показателей, но и разброс или вариацию значений отдельных единиц , которая является важной характеристикой изучаемой совокупности.

В наибольшей степени вариации подвержены курсы акций, объемы спроса и предложения, процентные ставки в разные периоды времени и в разных местах.

Основными показателями, характеризующими вариацию , являются размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Размах вариации представляет собой разность максимального и минимального значений признака: R = Xmax – Xmin . Недостатком данного показателя является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.

Дисперсия лишена этого недостатка. Она рассчитывается как средний квадрат отклонений значений признака от их средней величины:

Упрощенный способ расчета дисперсии осуществляется с помощью следующих формул (простой и взвешенной):

Примеры применения данных формул представлены в задачах 1 и 2.

Широко распространенным на практике показателем является среднее квадратическое отклонение :

Среднее квадратическое отклонение определяется как квадратный корень из дисперсии и имеет ту же размеренность, что и изучаемый признак.

Рассмотренные показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемого признака. В отличие от них, коэффициент вариации измеряет колеблемость в относительном выражении - относительно среднего уровня, что во многих случаях является предпочтительнее.

Формула для расчета коэффициента вариации.

Примеры решения задач по теме «Показатели вариации в статистике»

Задача 1 . При изучении влияния рекламы на размер среднемесячного вклада в банках района обследовано 2 банка. Получены следующие результаты:

Определить:
1) для каждого банка: а) средний размер вклада за месяц; б) дисперсию вклада;
2) средний размер вклада за месяц для двух банков вместе;
3) Дисперсию вклада для 2-х банков, зависящую от рекламы;
4) Дисперсию вклада для 2-х банков, зависящую от всех факторов, кроме рекламы;
5) Общую дисперсию используя правило сложения;
6) Коэффициент детерминации;
7) Корреляционное отношение.

Решение

1) Составим расчетную таблицу для банка с рекламой . Для определения среднего размера вклада за месяц найдем середины интервалов. При этом величина открытого интервала (первого) условно приравнивается к величине интервала, примыкающего к нему (второго).

Средний размер вклада найдем по формуле средней арифметической взвешенной:

29 000/50 = 580 руб.

Дисперсию вклада найдем по формуле:

23 400/50 = 468

Аналогичные действия произведем для банка без рекламы :

2) Найдем средний размер вклада для двух банков вместе. Хср =(580×50+542,8×50)/100 = 561,4 руб.

3) Дисперсию вклада, для двух банков, зависящую от рекламы найдем по формуле: σ 2 =pq (формула дисперсии альтернативного признака). Здесь р=0,5 – доля факторов, зависящих от рекламы; q=1-0,5, тогда σ 2 =0,5*0,5=0,25.

4) Поскольку доля остальных факторов равна 0,5, то дисперсия вклада для двух банков, зависящая от всех факторов кроме рекламы тоже 0,25.

5) Определим общую дисперсию, используя правило сложения.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 факт + σ 2 ост = 552,08+345,96 = 898,04

6) Коэффициент детерминации η 2 = σ 2 факт / σ 2 = 345,96/898,04 = 0,39 = 39% - размер вклада на 39% зависит от рекламы.

7) Эмпирическое корреляционное отношение η = √η 2 = √0,39 = 0,62 – связь достаточно тесная.

Задача 2 . Имеется группировка предприятий по величине товарной продукции:

Определить: 1) дисперсию величины товарной продукции; 2) среднее квадратическое отклонение; 3) коэффициент вариации.

Решение

1) По условию представлен интервальный ряд распределения. Его необходимо выразить дискретно, то есть найти середину интервала (х"). В группах закрытых интервалов середину найдем по простой средней арифметической. В группах с верхней границей - как разность между этой верхней границей и половиной размера следующего за ним интервала (200-(400-200):2=100).

В группах с нижней границей – суммой этой нижней границы и половины размера предыдущего интервала (800+(800-600):2=900).

Расчет средней величины товарной продукции делаем по формуле:

Хср = k×((Σ((х"-a):k)×f):Σf)+a. Здесь а=500 - размер варианта при наибольшей частоте, k=600-400=200 - размер интервала при наибольшей частоте. Результат поместим в таблицу:

Итак, средняя величина товарной продукции за изучаемый период в целом равна Хср = (-5:37)×200+500=472,97 тыс. руб.

2) Дисперсию найдем по следующей формуле:

σ 2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05

3) среднее квадратическое отклонение: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 тыс. руб.

4) коэффициент вариации: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52%

Пример : Требуется определить средний возраст студента заочной формы обучения по данным, заданным в следующей таблице:

Возраст студентов, лет (х )

Число студентов, чел (f )

среднее значение интервала (x",xцентральн )

xi *f i

26 и старше

Итого:

Для вычисления средней в интервальных рядах сначала определяют среднее значение интервала как полу-сумму верхней и нижней границы, а затем рассчитывается средняя величина по формуле средне арифметическая взвешенная.

Выше дан пример с равными интервалами, причем 1-й и последний являются открытыми.

Ответ: средний возраст студента составляет 22,6 года или примерно 23 года.

Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Используется в тех случаях, когда статистическая информация не содержит частот по отдельным значениям признака, а представлена произведением значения признака на частоту . Средняя гармоническая как вид степенной средней выглядит следующим образом:

В зависимости от формы представления исходных данных средняя гармоническая может быть рассчитана как простая и как взвешенная. Если исходные данные несгруппированны, то применяется средняя гармоническая простая :

К ней прибегают в случаях определения, например, средних затрат труда, материалов и т. д. на единицу продукции по нескольким предприятиям.

При работе со сгруппированными данными используется средняя гармоническая взвешенная :

Средняя геометрическая применяется в тех случаях, когда общий объем усредняемого признака является мультипликативной величиной ,т.е. определяется не суммированием, а умножением индивидуальныхзначений признака .

Форма средней геометрической взвешенной в практических расчётах не применяется .

Средняя квадратическая используется в тех случаях, когда при замене индивидуальных значений признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин .

Главная сфера её использования – измерение степени колеблемости индивидуальных значений признака относительно средней арифметической (среднее квадратическое отклонение). Кроме этого, средняя квадратическая применяется в тех случаях, когда необходимо вычислить средний величину признака, выраженного в квадратных или кубических единицах измерения (при вычислении средней величины квадратных участков, средних диаметров труб, стволов и т. д.).

Средняя квадратическая рассчитывается в двух формах:

Все степенные средние различаются между собой значениями показателя степени. При этом, чем выше показатель степени, тем больше количественное значение среднего показателя :

Это свойство степенных средних называется свойством мажорантности средних .