O gruparea datelor în intervale este folosit pentru a obține distribuția de frecvență în seturi de date continue sau cu multe observații, chiar dacă sunt valori discrete.
Vezi mai mult
Elevii din Rio de Janeiro vor concura pentru medalii la Jocurile Olimpice...
Institutul de Matematică este deschis pentru înscrieri la Jocurile Olimpice...
din analiza datelor este posibilă extragerea de informații și obținerea de perspective pentru luarea unor decizii importante, în mediul academic și corporativ.
Cu toate acestea, datele brute spun puțin sau nimic despre comportamentul unei variabile, ceea ce face necesară utilizarea tehnicilor de organizare și rezumare a datelor, cum ar fi distribuția de frecvență.
Când numărăm de câte ori apare o valoare într-un set de date, o primim frecventa absoluta.
Calculând frecvențele fiecăreia dintre valorile posibile ale unei variabile, obținem distribuția de frecvență.
Împărțind frecvența absolută la numărul total de observații, putem obține și frecventa relativa.
Exemplu:
Distribuția de frecvență a numărului de copii ai angajaților unei companii.
Când un set de date are multe observații sau datele sunt continue, acestea trebuie grupate în intervale și se obțin frecvențe pentru fiecare interval, numit și clasă.
Consultați pașii pentru a obține gruparea datelor.
primul pas) Definiți numărul de clase.
Nu există o regulă pentru numărul de clase.
Totuși, dacă sunt luate în considerare multe clase, datele nu vor fi rezumate, vom avea un tabel foarte mare. Pe de altă parte, dacă se iau în considerare puține clase, vom pierde informații despre date, vom avea un tabel foarte redus.
Astfel, idealul este de a determina numărul de clase în funcție de natura datelor și de cunoștințele pe care le deține despre acestea.
al 2-lea pas) Calculați gama de clase.
Pentru a calcula intervalul de clase, avem nevoie de numărul de clase și intervalul total.
Fiind asta:
al 3-lea pas) Calculați limitele clasei.
Clasele sunt formate din limita inferioară (Li) și limita superioară (Ls) și pot fi exprimate astfel:
Ceea ce indică faptul că intervalul conține valori mai mari sau egale cu Li și mai mici decât Ls, adică este intervalul [Li, Ls).
Prima clasă începe cu Li fiind cea mai mică valoare a datelor. Pentru a obține L, adăugăm Li la gama de clase.
Celelalte clase sunt obținute într-un mod similar, considerând Li ca valoarea Ls a clasei anterioare.
Exemplu:
Luați în considerare înălțimile, în cm, a 25 de elevi de educație fizică, în ordine crescătoare.
159 160 164 168 169 169 169 170 172 172 173 175 175 175 177 179 180 182 182 184 186 186 188 190 192
Să luăm în considerare 5 clase.
Clasa întâi:
Li = 159 și Ls = 159 + 6,6 = 165,6
Clasa a doua:
Li = 165,6 și Ls = 165,6 + 6,6 = 172,2
Clasa a treia:
Li = 172,2 și Ls = 172,2 + 6,6 = 178,8
Clasa a patra:
Li = 178,8 și Ls = 178,8 + 6,6 = 185,4
Clasa a cincea:
Li = 185,4 și Ls = 185,4 + 6,6 = 192
Distribuția de frecvență a înălțimilor celor 25 de elevi de Educație Fizică:
Clase de înălțime (cm) | frecventa absoluta | frecventa relativa |
3 | 0,12 | |
7 | 0,28 | |
5 | 0,2 | |
5 | 0,2 | |
5 | 0,2 | |
Total | 25 | 1 |
Notă: În ultima clasă, limita superioară aparține clasei.
Te-ar putea interesa și: