○ データを範囲にグループ化する を取得するために使用されます 頻度分布 連続データセットまたは多数の観測値 (離散値であっても)。
続きを見る
リオデジャネイロの学生がオリンピックでメダルを目指して競い合います…
数学研究所はオリンピックへの登録を受け付けています…
から データ分析 学術環境や企業環境において、重要な意思決定を行うための情報を抽出し、洞察を得ることが可能です。
ただし、生データは変数の動作についてほとんど、またはまったく語らないため、データを整理して要約するための手法を使用する必要があります。 頻度分布.
データセット内に値が出現する回数をカウントすると、その値が得られます。 絶対周波数.
変数の取り得る値のそれぞれの頻度を計算することにより、頻度分布が得られます。
絶対頻度を観測値の総数で割ると、次の値を得ることができます。 相対頻度.
例:
企業の従業員の子供の数の度数分布。
データ セットに多くの観測値がある場合、またはデータが連続している場合は、それらを間隔にグループ化し、各間隔の頻度 (クラスとも呼ばれます) を取得する必要があります。
データのグループ化を取得する手順を参照してください。
最初のステップ) クラスの数を定義します。
クラス数に決まりはありません。
ただし、多くのクラスを考慮すると、データは要約されず、非常に大きなテーブルが作成されます。 一方、考慮されるクラスがほとんどない場合は、データに関する情報が失われ、非常に縮小されたテーブルになります。
したがって、データの性質とデータについての知識に基づいてクラスの数を決定するのが理想的です。
2ステップ目) クラスの範囲を計算します。
クラスの範囲を計算するには、クラスの数と合計範囲が必要です。
それは次のとおりです。
3ステップ目) クラスの制限を計算します。
クラスは下限値 (Li) と上限値 (Ls) によって形成され、次のように表すことができます。
これは、区間に Li 以上 Ls 未満の値が含まれること、つまり区間 [Li, Ls) であることを示します。
最初のクラスは、Li が最小のデータ値で始まります。 Ls を取得するには、クラスの範囲に Li を追加します。
他のクラスも同様の方法で取得され、Li を前のクラスの Ls 値とみなします。
例:
体育学生 25 人の身長を小さい順に cm 単位で考えます。
159 160 164 168 169 169 169 170 172 172 173 175 175 175 177 179 180 182 182 184 186 186 188 190 192
5つのクラスを考えてみましょう。
ファーストクラス:
Li = 159 および Ls = 159 + 6.6 = 165.6
2 番目のクラス:
Li = 165.6 および Ls = 165.6 + 6.6 = 172.2
3 番目のクラス:
Li = 172.2 および Ls = 172.2 + 6.6 = 178.8
4 番目のクラス:
Li = 178.8 および Ls = 178.8 + 6.6 = 185.4
5 番目のクラス:
Li = 185.4 および Ls = 185.4 + 6.6 = 192
体育科の学生 25 人の身長の度数分布:
身長クラス(cm) | 絶対周波数 | 相対頻度 |
3 | 0,12 | |
7 | 0,28 | |
5 | 0,2 | |
5 | 0,2 | |
5 | 0,2 | |
合計 | 25 | 1 |
注: 最後のクラスでは、上限はクラスに属します。
こちらにも興味があるかもしれません: