О группировка данных в диапазоны используется для получения Распределение частоты в непрерывных наборах данных или со многими наблюдениями, даже если они являются дискретными значениями.
узнать больше
Студенты из Рио-де-Жанейро поборются за медали на Олимпиаде…
Институт математики открыт для регистрации на Олимпиаду…
от анализ данных можно извлекать информацию и получать информацию для принятия важных решений в академической и корпоративной среде.
Однако необработанные данные мало или совсем ничего не говорят о поведении переменной, что делает необходимым использование методов для организации и обобщения данных, таких как Распределение частоты.
Когда мы подсчитываем, сколько раз значение появляется в наборе данных, мы получаем его абсолютная частота.
Вычисляя частоты каждого из возможных значений переменной, получаем частотное распределение.
Разделив абсолютную частоту на общее количество наблюдений, мы также можем получить относительная частота.
Пример:
Частотное распределение количества детей сотрудников компании.
Когда в наборе данных много наблюдений или данные непрерывны, они должны быть сгруппированы в интервалы, и частоты получены для каждого интервала, также называемого классом.
См. шаги, чтобы получить группировку данных.
1-й шаг) Определите количество классов.
Нет правила для количества классов.
Однако если рассматривать много классов, то данные не будут суммироваться, у нас будет очень большая таблица. С другой стороны, если рассматривать несколько классов, мы потеряем информацию о данных, у нас будет очень сокращенная таблица.
Таким образом, в идеале количество классов должно определяться на основе характера данных и знаний о них.
2-й шаг) Рассчитать диапазон классов.
Для расчета ассортимента классов нам понадобится количество классов и общий ассортимент.
Быть тем:
3-й шаг) Вычислить ограничения класса.
Классы образованы нижним пределом (Li) и верхним пределом (Ls) и могут быть выражены следующим образом:
Что указывает на то, что интервал содержит значения большие или равные Li и меньшие Ls, то есть это интервал [Li, Ls).
Первый класс начинается с Li, являющегося наименьшим значением данных. Чтобы получить Ls, мы добавляем Li к диапазону классов.
Аналогично получаются остальные классы, рассматривая Li как значение Ls предыдущего класса.
Пример:
Рассмотрим рост в см 25 учащихся физкультуры в порядке возрастания.
159 160 164 168 169 169 169 170 172 172 173 175 175 175 177 179 180 182 182 184 186 186 188 190 192
Рассмотрим 5 классов.
Первый класс:
Li = 159 и Ls = 159 + 6,6 = 165,6
Второй класс:
Li = 165,6 и Ls = 165,6 + 6,6 = 172,2
Третий класс:
Li = 172,2 и Ls = 172,2 + 6,6 = 178,8
Четвертый класс:
Li = 178,8 и Ls = 178,8 + 6,6 = 185,4
Пятый класс:
Li = 185,4 и Ls = 185,4 + 6,6 = 192
Частотное распределение роста 25 студентов физкультуры:
Классы роста (см) | абсолютная частота | относительная частота |
3 | 0,12 | |
7 | 0,28 | |
5 | 0,2 | |
5 | 0,2 | |
5 | 0,2 | |
Общий | 25 | 1 |
Примечание. В последнем классе верхний предел принадлежит классу.
Вам также может быть интересно: