O gruppering af data i områder bruges til at få frekvensfordeling i kontinuerlige datasæt eller med mange observationer, selvom det er diskrete værdier.
se mere
Studerende fra Rio de Janeiro vil konkurrere om medaljer ved OL...
Institut for Matematik er åben for tilmelding til OL...
fra dataanalyse det er muligt at udtrække information og få indsigt til at træffe vigtige beslutninger, i det akademiske miljø og virksomhedsmiljø.
Rå data siger imidlertid lidt eller intet om en variabels adfærd, hvilket gør det nødvendigt at bruge teknikker til at organisere og opsummere dataene, som f.eks. frekvensfordeling.
Når vi tæller, hvor mange gange en værdi vises i et datasæt, får vi dens absolut frekvens.
Ved at beregne frekvenserne for hver af de mulige værdier af en variabel får vi frekvensfordelingen.
Ved at dividere den absolutte frekvens med det samlede antal observationer kan vi også få relativ hyppighed.
Eksempel:
Frekvensfordeling af antallet af børn af en virksomheds ansatte.
Når et datasæt har mange observationer, eller dataene er kontinuerte, skal de grupperes i intervaller, og der opnås frekvenser for hvert interval, også kaldet en klasse.
Se trin for at få datagruppering.
1. trin) Definer antallet af klasser.
Der er ingen regel for antallet af klasser.
Men hvis mange klasser tages i betragtning, vil dataene ikke blive opsummeret, vi vil have en meget stor tabel. På den anden side, hvis få klasser tages i betragtning, vil vi miste information om dataene, vi vil have en meget reduceret tabel.
Det ideelle er således at bestemme antallet af klasser ud fra arten af dataene og den viden, man har om dem.
2. trin) Beregn rækken af klasser.
For at beregne rækkevidden af klasser har vi brug for antallet af klasser og den samlede rækkevidde.
At være det:
3. trin) Beregn klassegrænser.
Klasserne er dannet af den nedre grænse (Li) og øvre grænse (Ls) og kan udtrykkes som følger:
Hvilket indikerer, at intervallet indeholder værdier større end eller lig med Li og mindre end Ls, det vil sige, det er intervallet [Li, Ls).
Den første klasse starter med, at Li er den mindste dataværdi. For at opnå L'er tilføjer vi Li til rækken af klasser.
De andre klasser opnås på lignende måde, idet Li betragtes som Ls-værdien af den foregående klasse.
Eksempel:
Overvej højderne i cm af 25 idrætselever i stigende rækkefølge.
159 160 164 168 169 169 169 170 172 172 173 175 175 175 177 179 180 182 182 184 186 186 188 190 192
Lad os overveje 5 klasser.
Første klasse:
Li = 159 og Ls = 159 + 6,6 = 165,6
Anden klasse:
Li = 165,6 og Ls = 165,6 + 6,6 = 172,2
Tredje klasse:
Li = 172,2 og Ls = 172,2 + 6,6 = 178,8
Fjerde klasse:
Li = 178,8 og Ls = 178,8 + 6,6 = 185,4
Femte klasse:
Li = 185,4 og Ls = 185,4 + 6,6 = 192
Frekvensfordeling af højderne for de 25 idrætselever:
Højdeklasser (cm) | absolut frekvens | relativ hyppighed |
3 | 0,12 | |
7 | 0,28 | |
5 | 0,2 | |
5 | 0,2 | |
5 | 0,2 | |
Total | 25 | 1 |
Bemærk: I den sidste klasse hører den øvre grænse til klassen.
Du kan også være interesseret: