도수분포표의 특징과 제한점

이번시간에는 도수분포표의 특징과 제한점에 대해 살펴보고, 앞서 학습한 줄기와 잎 그림과 비교해 보도록 하겠습니다.

도수분포표 정의

다음과 같이 주어진 변량을 계급과 도수를 이용해 표로 정리한 것을 도수분포표 라고 한다.

  • 62, 87, 97, 73, 59, 85, 80, 79, 65, 75
점수(점)
$\textcolor{blue}{\text{계급}}$
학생수(명)
$\textcolor{blue}{\text{도수}}$
$\textcolor{blue}{\text{계급값}}$(명)
$50^\text{이상} \sim 60^\text{미만}$155
$60^\text{이상} \sim 70^\text{미만}$265
$70^\text{이상} \sim 80^\text{미만}$375
$80^\text{이상} \sim 90^\text{미만}$385
$90^\text{이상} \sim 100^\text{미만}$195
합계10

도수분포표 : 주어진 변량 $\xrightarrow[\quad \text{도수}\quad]{\quad\text{계급}\quad}$ 표

  1. 계급 : 변량을 $\bbox[#ffff00]{\text{일정한 간격}}$으로 나눈 구간
    • $\bbox[#ffff00]{\text{계급의 크기}}$ : 구간의 너비 (양 끝값의 차)
      • 주어진 자료 : 10 (점)
    • 계급의 개수 : 변량을 구간으로 나눈 개수
      • 주어진 자료 : 5 (개)
    • 계급값 : 계급을 대표하는 값(중앙의 값)
  2. 도수 : 각 계급에 속하는 자료의 개수

계급 설정시 주의사항

  1. 계급의 개수 : 5~15개
    • 계급의 개수가 너무 많거나 너무 적으면 : 변량이 지나치게 분산, 밀집되어 분포가 드러나지 않음.
  2. 계급의 크기(구간의 너비)를 모두 같게
  3. 계급의 구간 설정 : 자료의 누락 방지, 중복방지
    • $\triangle^\text{이상}\sim\bbox[#ffff00]{\square}^\bbox[#dcff8c]{\text{미만}}$
    • $\bbox[#ffff00]{\square}^\bbox[#dcff8c]{\text{이상}}\sim\bigcirc^\text{미만}$

만드는 순서 절차

  1. 가장 큰 변량, 작은 변량 찾기.
  2. 계급의 개수 결정 $\rightarrow$ 계급 구간 설정
  3. 변량이 속한 계급을 찾아 탤리마크(||||)로 표기
    • tally marks : |, ||, |||, ||||, ||||

도수분포표 만들기

주어진 변량에 대한 도수분포표를 만들어보자.

[A반 단원평가 점수]

141529240
173381922
3324313410
13918827

[A반 단원평가 점수 도수분포표]

점수(점) $\textcolor{blue}{\text{계급}}$학생수(명) $\textcolor{blue}{\text{도수}}$tally marks
$0^\text{이상} \sim 8^\text{미만}$3|||
$8^\text{이상} \sim 16^\text{미만}$4||||
$16^\text{이상} \sim 24^\text{미만}$4||||
$24^\text{이상} \sim 32^\text{미만}$5||||
$32^\text{이상} \sim 40^\text{미만}$4||||
합계20

[B반 단원평가 점수]

122628518
2130112314
323313312
380241339
351702510

[B반 단원평가 점수 도수분포표]

점수(점) $\textcolor{blue}{\text{계급}}$학생수(명) $\textcolor{blue}{\text{도수}}$tally marks
$0^\text{이상} \sim 8^\text{미만}$4||||
$8^\text{이상} \sim 16^\text{미만}$6|||| |
$16^\text{이상} \sim 24^\text{미만}$5||||
$24^\text{이상} \sim 32^\text{미만}$6|||| |
$32^\text{이상} \sim 40^\text{미만}$4||||
합계25

두 집단의 비교

도수분포표 : 가능

도수분포표를 다음과 같이 응용하여 두 집단을 비교할 수 있다.

점수 (계급)A반
학생수(명)
B반
학생수(명)
$0^\text{이상} \sim 8^\text{미만}$34
$8^\text{이상} \sim 16^\text{미만}$46
$16^\text{이상} \sim 24^\text{미만}$45
$24^\text{이상} \sim 32^\text{미만}$56
$32^\text{이상} \sim 40^\text{미만}$44
합계2025

특징, 제한점

특징 (장점)

  • 자료의 분포를 한 눈에 볼 수 있음.
  • 변량의 수가 많은 자료 분석 유리
  • 도수를 한 눈에 알아 보기 쉬움
  • 계급의 개수를 원하는 만큼 조절 가능
    • 변량의 분포와 상관없이 이용 가능

제한점 (단점)

  • 변량의 정확한 값을 알 수 없음
  • 특정 위치의 값을 알 수 없음 (중앙값)

도수 분포표와 줄기와 잎 그림 비교

줄기와 잎 그림도수분포표
자료의 분포를 한 눈에 파악자료의 분포를 한눈에 파악
원자료의 값을 유지원자료의 값 알 수 없음
크기 순서 나열특정 위치를 알 수 없음
변량의 수가 적은 자료변량의 수가 많은 자료
개수를 세어야 함도수(개수)를 표기
밀집, 분산된 자료 분석 X
(줄기의 범위 고정)
분포와 상관 없이 사용가능
(계급의 개수 조절 가능)

다음 시간에는 도수분포표를 시각적으로 표현하는 방법에 대해 알아봅시다.

중고등학교 통계 프로그램 사이트

중고등학교 통계수업에 활용할 수 있는 프로그램을 제공하는 사이트 입니다.