Статистика - Среднее
Среднее - это тип среднего значения, которое описывает, где находится центр данных.
Среднее
Среднее значение обычно называют "средним".
Среднее значение - это сумма всех значений в данных, делённая на общее количество значений в данных.
Среднее значение рассчитывается для числовых переменных. Переменная - это что-то в данных, которое может варьироваться, например:
- Возраст
- Высота
- Доход
Примечание: Есть несколько типов средних значений. Самый распространенный тип среднего - это среднее арифметическое.
В этом учебнике под "средним" понимается среднее арифметическое.
Расчет среднего
Вы можете рассчитать среднее значение как для совокупности, так и для выборки.
Формулы одинаковы и используют разные символы для обозначения среднего по генеральной совокупности (\(\mu\)) и выборочного среднего (\(\bar{x}\)).
Расчёт среднего численного значения (\(\mu\)) выполняется по этой формуле:
\(\displaystyle \mu = \frac{\sum x_{i}}{n}\)
Расчёт среднего выборки (\(\bar{x}\)) выполняется по этой формуле:
\(\displaystyle \bar{x} = \frac{\sum x_{i}}{n}\)
Нижняя часть дроби (\(n\)) - это общее количество наблюдений.
\(\sum \) - это символ для сложения списка чисел.
\(x_{i}\) - это список значений в данных: \(x_{1}, x_{2}, x_{3}, \ldots \)
Верхняя часть дроби (\(\sum x_{i}\)) - это сумма \(x_{1}, x_{2}, x_{3}, \ldots \) сложенных вместе.
Итак, если в выборке есть 4 наблюдения со значениями: 4, 11, 7, 14, расчет будет:
\(\displaystyle \bar{x} = \frac{4 + 11 + 7 + 14}{4} = \frac{36}{4} = \underline{9} \)
Расчёт с программированием
Среднее значение можно легко вычислить с помощью многих языков программирования.
Использование программного обеспечения и программирования для расчета статистики более распространено для больших наборов данных, поскольку расчет вручную становится затруднительным.
Пример
В Python используйте метод mean() библиотеки NumPy, чтобы найти среднее значение 4,11,7,14:
import numpy
values = [4,11,7,14]
x = numpy.mean(values)
print(x)
Попробуйте сами »
Пример
Используйте функцию R mean() чтобы найти среднее значение 4,11,7,14:
values <- c(4,7,11,14)
mean(values)
Попробуйте сами »
Справка по символам статистики
| Символ | Описание |
|---|---|
| \( \mu \) | Среднее совокупности. Произносится 'mu'. |
| \( \bar{x} \) | Среднее значение выборки. Произносится как 'x-bar'. |
| \( \sum \) | Оператор суммирования, 'заглавная сигма'. |
| \( x \) | По переменной 'x' мы вычисляем среднее значение для неё. |
| \( i \) | Индекс 'i' переменной 'x'. Это идентифицирует каждое наблюдение для переменной. |
| \( n \) | Количество наблюдений. |

