О групиране на данни в диапазони се използва за получаване на честотно разпределение в непрекъснати набори от данни или с много наблюдения, дори ако те са дискретни стойности.
виж повече
Ученици от Рио де Жанейро ще се борят за медали на олимпиадата...
Институтът по математика е отворен за записване за олимпиадата...
от Анализ на данни възможно е да се извлече информация и да се получат прозрения за вземане на важни решения в академичната и корпоративната среда.
Суровите данни обаче казват малко или нищо за поведението на дадена променлива, което налага използването на техники за организиране и обобщаване на данните, като например честотно разпределение.
Когато преброим колко пъти дадена стойност се появява в набор от данни, ние получаваме нейната абсолютна честота.
Чрез изчисляване на честотите на всяка от възможните стойности на променлива, ние получаваме честотното разпределение.
Като разделим абсолютната честота на общия брой наблюдения, можем също да получим относителна честота.
Пример:
Честотно разпределение на броя на децата на служителите на фирмата.
Когато даден набор от данни има много наблюдения или данните са непрекъснати, те трябва да бъдат групирани в интервали и за всеки интервал се получават честоти, наричани още клас.
Вижте стъпките за получаване на групиране на данни.
1ва стъпка) Определете броя на класовете.
Няма правило за броя на часовете.
Ако обаче се разглеждат много класове, данните няма да бъдат обобщени, ще имаме много голяма таблица. От друга страна, ако се вземат предвид малко класове, ще загубим информация за данните, ще имаме много намалена таблица.
По този начин идеалът е да се определи броят на класовете въз основа на естеството на данните и знанията, които човек има за тях.
2-ра стъпка) Изчислете обхвата на класовете.
За да изчислим обхвата на класовете, имаме нужда от броя на класовете и общия обхват.
като това:
3-та стъпка) Ограничения за изчислителен клас.
Класовете се образуват от долната граница (Li) и горната граница (Ls) и могат да бъдат изразени, както следва:
Което показва, че интервалът съдържа стойности, по-големи или равни на Li и по-малки от Ls, тоест това е интервалът [Li, Ls).
Първият клас започва с Li като най-малката стойност на данните. За да получим Ls, добавяме Li към диапазона от класове.
Останалите класове се получават по подобен начин, като Li се счита за Ls стойност на предишния клас.
Пример:
Помислете за ръстовете в cm на 25 ученици по физическо възпитание във възходящ ред.
159 160 164 168 169 169 169 170 172 172 173 175 175 175 177 179 180 182 182 184 186 186 188 190 192
Нека разгледаме 5 класа.
Първи клас:
Li = 159 и Ls = 159 + 6,6 = 165,6
Втори клас:
Li = 165,6 и Ls = 165,6 + 6,6 = 172,2
Трети клас:
Li = 172,2 и Ls = 172,2 + 6,6 = 178,8
Четвърти клас:
Li = 178,8 и Ls = 178,8 + 6,6 = 185,4
пети клас:
Li = 185,4 и Ls = 185,4 + 6,6 = 192
Честотно разпределение на ръста на 25-те студенти по физическо възпитание:
Височинни класове (cm) | абсолютна честота | относителна честота |
3 | 0,12 | |
7 | 0,28 | |
5 | 0,2 | |
5 | 0,2 | |
5 | 0,2 | |
Обща сума | 25 | 1 |
Забележка: В последния клас горната граница принадлежи на класа.
Може също да се интересувате от: