이번시간에는 도수분포표의 특징과 제한점에 대해 살펴보고, 앞서 학습한 줄기와 잎 그림과 비교해 보도록 하겠습니다.
개요
도수분포표 정의
다음과 같이 주어진 변량을 계급과 도수를 이용해 표로 정리한 것을 도수분포표 라고 한다.
- 62, 87, 97, 73, 59, 85, 80, 79, 65, 75
점수(점) $\textcolor{blue}{\text{계급}}$ | 학생수(명) $\textcolor{blue}{\text{도수}}$ | $\textcolor{blue}{\text{계급값}}$(명) |
---|---|---|
$50^\text{이상} \sim 60^\text{미만}$ | 1 | 55 |
$60^\text{이상} \sim 70^\text{미만}$ | 2 | 65 |
$70^\text{이상} \sim 80^\text{미만}$ | 3 | 75 |
$80^\text{이상} \sim 90^\text{미만}$ | 3 | 85 |
$90^\text{이상} \sim 100^\text{미만}$ | 1 | 95 |
합계 | 10 |
도수분포표 : 주어진 변량 $\xrightarrow[\quad \text{도수}\quad]{\quad\text{계급}\quad}$ 표
- 계급 : 변량을 $\bbox[#ffff00]{\text{일정한 간격}}$으로 나눈 구간
- $\bbox[#ffff00]{\text{계급의 크기}}$ : 구간의 너비 (양 끝값의 차)
- 주어진 자료 : 10 (점)
- 계급의 개수 : 변량을 구간으로 나눈 개수
- 주어진 자료 : 5 (개)
- 계급값 : 계급을 대표하는 값(중앙의 값)
- $\bbox[#ffff00]{\text{계급의 크기}}$ : 구간의 너비 (양 끝값의 차)
- 도수 : 각 계급에 속하는 자료의 개수
계급 설정시 주의사항
- 계급의 개수 : 5~15개
- 계급의 개수가 너무 많거나 너무 적으면 : 변량이 지나치게 분산, 밀집되어 분포가 드러나지 않음.
- 계급의 크기(구간의 너비)를 모두 같게
- 계급의 구간 설정 : 자료의 누락 방지, 중복방지
- $\triangle^\text{이상}\sim\bbox[#ffff00]{\square}^\bbox[#dcff8c]{\text{미만}}$
- $\bbox[#ffff00]{\square}^\bbox[#dcff8c]{\text{이상}}\sim\bigcirc^\text{미만}$
만드는 순서 절차
- 가장 큰 변량, 작은 변량 찾기.
- 계급의 개수 결정 $\rightarrow$ 계급 구간 설정
- 변량이 속한 계급을 찾아 탤리마크(
||||)로 표기- tally marks : |, ||, |||, ||||,
||||
- tally marks : |, ||, |||, ||||,
도수분포표 만들기
주어진 변량에 대한 도수분포표를 만들어보자.
[A반 단원평가 점수]
14 | 15 | 29 | 24 | 0 |
17 | 3 | 38 | 19 | 22 |
33 | 24 | 31 | 34 | 10 |
1 | 39 | 18 | 8 | 27 |
[A반 단원평가 점수 도수분포표]
점수(점) $\textcolor{blue}{\text{계급}}$ | 학생수(명) $\textcolor{blue}{\text{도수}}$ | tally marks |
---|---|---|
$0^\text{이상} \sim 8^\text{미만}$ | 3 | ||| |
$8^\text{이상} \sim 16^\text{미만}$ | 4 | |||| |
$16^\text{이상} \sim 24^\text{미만}$ | 4 | |||| |
$24^\text{이상} \sim 32^\text{미만}$ | 5 | |
$32^\text{이상} \sim 40^\text{미만}$ | 4 | |||| |
합계 | 20 |
[B반 단원평가 점수]
12 | 26 | 28 | 5 | 18 |
21 | 30 | 11 | 23 | 14 |
3 | 23 | 31 | 33 | 12 |
38 | 0 | 24 | 13 | 39 |
35 | 17 | 0 | 25 | 10 |
[B반 단원평가 점수 도수분포표]
점수(점) $\textcolor{blue}{\text{계급}}$ | 학생수(명) $\textcolor{blue}{\text{도수}}$ | tally marks |
---|---|---|
$0^\text{이상} \sim 8^\text{미만}$ | 4 | |||| |
$8^\text{이상} \sim 16^\text{미만}$ | 6 | |
$16^\text{이상} \sim 24^\text{미만}$ | 5 | |||| |
$24^\text{이상} \sim 32^\text{미만}$ | 6 | |
$32^\text{이상} \sim 40^\text{미만}$ | 4 | |||| |
합계 | 25 |
두 집단의 비교
도수분포표 : 가능
도수분포표를 다음과 같이 응용하여 두 집단을 비교할 수 있다.
점수 (계급) | A반 학생수(명) | B반 학생수(명) |
---|---|---|
$0^\text{이상} \sim 8^\text{미만}$ | 3 | 4 |
$8^\text{이상} \sim 16^\text{미만}$ | 4 | 6 |
$16^\text{이상} \sim 24^\text{미만}$ | 4 | 5 |
$24^\text{이상} \sim 32^\text{미만}$ | 5 | 6 |
$32^\text{이상} \sim 40^\text{미만}$ | 4 | 4 |
합계 | 20 | 25 |
특징, 제한점
특징 (장점)
- 자료의 분포를 한 눈에 볼 수 있음.
- 변량의 수가 많은 자료 분석 유리
- 도수를 한 눈에 알아 보기 쉬움
- 계급의 개수를 원하는 만큼 조절 가능
- 변량의 분포와 상관없이 이용 가능
제한점 (단점)
- 변량의 정확한 값을 알 수 없음
- 특정 위치의 값을 알 수 없음 (중앙값)
도수 분포표와 줄기와 잎 그림 비교
줄기와 잎 그림 | 도수분포표 |
자료의 분포를 한 눈에 파악 | 자료의 분포를 한눈에 파악 |
원자료의 값을 유지 | 원자료의 값 알 수 없음 |
크기 순서 나열 | 특정 위치를 알 수 없음 |
변량의 수가 적은 자료 | 변량의 수가 많은 자료 |
개수를 세어야 함 | 도수(개수)를 표기 |
밀집, 분산된 자료 분석 X (줄기의 범위 고정) | 분포와 상관 없이 사용가능 (계급의 개수 조절 가능) |
다음 시간에는 도수분포표를 시각적으로 표현하는 방법에 대해 알아봅시다.
중고등학교 통계 프로그램 사이트
중고등학교 통계수업에 활용할 수 있는 프로그램을 제공하는 사이트 입니다.