O az adatok csoportosítása tartományokba megszerzésére használják gyakorisági eloszlását folyamatos adathalmazokban vagy sok megfigyeléssel, még akkor is, ha ezek diszkrét értékek.
többet látni
Rio de Janeiró-i diákok érmekért küzdenek az olimpián…
A Matematikai Intézetben lehet jelentkezni az olimpiára…
tól től adatelemzés lehetõség nyílik információ kinyerésére és betekintésre a fontos döntések meghozatalához, tudományos és vállalati környezetben.
A nyers adatok azonban keveset vagy semmit sem mondanak el egy változó viselkedéséről, ezért olyan technikákat kell alkalmazni az adatok rendszerezésére és összegezésére, mint pl. gyakorisági eloszlását.
Ha megszámoljuk, hogy egy érték hányszor jelenik meg egy adatkészletben, megkapjuk az értékét abszolút frekvencia.
Egy változó egyes lehetséges értékeinek gyakoriságának kiszámításával megkapjuk a gyakorisági eloszlást.
Az abszolút gyakoriságot elosztva a megfigyelések teljes számával, megkaphatjuk a relatív gyakoriság.
Példa:
Egy cég alkalmazottainak gyermekszámának gyakorisági megoszlása.
Ha egy adathalmaz sok megfigyelést tartalmaz, vagy az adatok folytonosak, akkor azokat intervallumokba kell csoportosítani, és minden intervallumhoz gyakoriságot kell kapni, amelyet osztálynak is neveznek.
Tekintse meg az adatok csoportosításának lépéseit.
1. lépés) Határozza meg az osztályok számát.
Az osztályok számára nincs szabály.
Ha azonban sok osztályt veszünk figyelembe, akkor az adatok nem lesznek összesítve, nagyon nagy táblázatunk lesz. Másrészt, ha kevés osztályt veszünk figyelembe, elveszítjük az adatokkal kapcsolatos információkat, nagyon kicsinyített táblát kapunk.
Így az ideális az, ha az osztályok számát az adatok jellege és a velük kapcsolatos ismeretek alapján határozzuk meg.
2. lépés) Számítsa ki az osztályok körét!
Az osztályok körének kiszámításához szükségünk van az osztályok számára és a teljes tartományra.
Lévén, hogy:
3. lépés) Számítsa ki az osztályhatárokat.
Az osztályokat az alsó határ (Li) és a felső határ (Ls) alkotják, és a következőképpen fejezhetők ki:
Ez azt jelzi, hogy az intervallum Li-nél nagyobb vagy egyenlő és Ls-nál kisebb értékeket tartalmaz, vagyis ez az intervallum [Li, Ls).
Az első osztály azzal kezdődik, hogy Li a legkisebb adatérték. Az Ls megszerzéséhez Li-t adunk az osztályok tartományához.
A többi osztályt hasonló módon kapjuk meg, Li-t az előző osztály Ls értékének tekintve.
Példa:
Tekintsük 25 testnevelő tanuló magasságát cm-ben, növekvő sorrendben.
159 160 164 168 169 169 169 170 172 172 173 175 175 175 177 179 180 182 182 184 186 186 188 190 192
Tekintsünk 5 osztályt.
Első osztály:
Li = 159 és Ls = 159 + 6,6 = 165,6
Másodosztály:
Li = 165,6 és Ls = 165,6 + 6,6 = 172,2
Harmadik osztály:
Li = 172,2 és Ls = 172,2 + 6,6 = 178,8
Negyedik osztály:
Li = 178,8 és Ls = 178,8 + 6,6 = 185,4
Ötödik osztály:
Li = 185,4 és Ls = 185,4 + 6,6 = 192
A 25 testnevelő hallgató magasságának gyakorisági eloszlása:
Magassági osztályok (cm) | abszolút frekvencia | relatív gyakoriság |
3 | 0,12 | |
7 | 0,28 | |
5 | 0,2 | |
5 | 0,2 | |
5 | 0,2 | |
Teljes | 25 | 1 |
Megjegyzés: Az utolsó osztályban a felső határ az osztályhoz tartozik.
Önt is érdekelheti: