산포도의 정의와 예시 편차 분산 표준편차

수량으로 제시된 자료를 분석할 때 자료를 중심적 경향과 중심에서 흩어진 정도(산포도)를 파악하는 것이 기초적이다. 지난 시간에는 중심적 경향을 수치로 나타낸 값을 대푯값을 학습하였다. 이번 시간에는 자료의 흩어진 정도를 수치로 나타낸 산포도에 대하여 학습해 보자. 대푯값과 산포도는 자료의 중심적인 경향과 흩어진 정도를 수치로 나타내 주어 집단 사이를 비교할 수 있는 기준이 된다.

대푯값의 정의에 대해 학습하려면 아래의 링크를 이용하길 바란다.

학습목표

  • 산포도의 정의를 이해하고, 편차, 분산, 표준편차에 대해 정확히 설명할 수 있다.
  • 산포도인 분산과 표준편차를 계산할 수 있다.

효과적인 학습을 위해 학습지를 다운받아 사용하길 바란다.

산포도의 정의와 종류

산포도의 정의

산포도의 정의를 정확히 정리하고 종류별로 학습해 보기로 하자.

  • 산포도 : 변량의 흩어진 정도를 하나의 수로 나타낸 값
  • 산포도의 종류 : 분산, 표준편차

편차

편차의 정의 예시 성질

흩어진 정도를 수로 나타내는 가장 간편한 방법은 변량에서 평균값까지 차이를 계산하는 것이다. 이 개념을 편차라고 한다.

편차의 정의
  • 편차 : 각 변량에서 자료의 평균을 뺀 값.
    $(편차)=(변량)-(평균)$
편차의 성질

산포도는 자료의 흩어진 정도를 하나의 값으로 표현한 것을 의미한다. 따라서 편차는 산포도라고 할 수 없음에 유의하자.

평균 편차와 산포도
  • 편차의 총합은 항상 0 이다. $(\bigstar\;)$
  • 변량이 평균보다 크면 양수 평균보다 작으면 음수
  • 편차의 절댓값이 클 수록 변량이 평균에서 멀리 떨어져 있고, 절댓값이 작을수록 변량은 평균에 가까이 있다.

편차의 총합이 0이되는 이유는 아래와 같다.

  • $(편차의\;총합\;)= (변량의\;총합\;)-(평균\;)\times(변량의\;개수\;)=0$
    $\because (평균)=\dfrac{(변량의\;총합)}{(변량의\;개수)}\;\rightarrow\; (변량의\;총합\;)=(평균\;)\times(변량의\;개수\;)$

이러한 이유로 편차의 총합을 산포도로 사용할 수 없다.

편차의 절댓값을 이용한 산포도 계산

변량에 따라 다르게 나타나는 편차를 이용해 산포도를 표현하는 방법에 대해 생각해보자.

편차절댓값과 산포도
편차절댓값과 산포도

편차의 총합은 항상 0이기 때문에 산포도로 적절하지 않음을 학습하였다. 그렇다면 절댓값을 합하여 산포도를 구하는 방법에 대해 알아보자.

  • 평균 편차 절댓값의 합 $\;\geq\;$ 중앙값 편차 절댓값의 합
    산포도의 기준으로 잡은 값(대푯값)으로 계산한 결과는 항상 최솟값이어야 한다. 따라서 편차의 절댓값의 합을 이용하려면 중앙값을 대푯값으로 사용해야 한다.(참고 문헌 :나무위키)

중앙값을 이용한 산포도를 다루는 일은 중,고등학교에서는 다루지 않는다. 따라서 우리는 다른 방법으로 산포도를 구해야한다.

편차의 제곱을 이용한 산포도

평균을 이용한 산포도를 다룰 때 편차 절댓값의 총합은 사용할 수 없다. 편차의 총합이 0이 되는 사실을 피하고, 평균을 이용할 수 있는 방법은 편차제곱의 합을 이용하는 것이다. 다음의 두 집단의 예를 통해 어떻게 편차제곱을 이용해 산포도를 구할 수 있는지 학습해보자.

편차제곱을 이용한 산포도 분산, 표준편차
편차제곱을 이용한 산포도 분산, 표준편차

$(편차\;)^2$의 총합을 비교하면 자료 1 $>$ 자료 2 임을 알 수 있다. 그렇다면 자료1 의 흩어진 정도가 자료2 보다 크다고 할 수 있을까? 그렇지 않다! 변량의 개수가 5개인 자료1과 변량의 개수가 4개인 자료2를 비교하려면 $(편차\;)^2$의 평균값을 비교하는 것이 타당하기 때문이다. 이 값을 분산이라고 하고 분산의 음이아닌 제곱근을 표준편차라고 한다.

분산과 표준편차

정의
  • 분산 : $(편차\;)^2$ 의 평균
    $(분산\;)=\dfrac{(편차)^2\;의 \;총합\;}{(변량의\;개수)}$ $\; (단, (편차)=(변량)-(평균))$
  • 표준편차 : 분산의 음이 아닌 제곱근
    $(표준편차\;)=\sqrt{(분산\;)}$
분산, 표준편차 구하기

[예제] 주어진 자료의 분산과 표준편차를 구해보자.

  • 자료4 : 4, 3, 7, 12, 11, 5, 14
분산과 표준편차 예제 문제 풀이

계산과정에 실수를 줄이고 한눈에 보기 쉽게 정리하기 위해서 이와 같은 표의 형식을 사용하자. 참고서의 문제를 풀면서 왼쪽과 같은 표로 정리해서 풀이하는 연습을 하면 다양하게 제시된 자료를 정리하는 방법을 알 수 있고, 내용을 일관성 있게 정리하는데 도움이 된다.

정리

자료를 비교 분석하기 위해 자료의 흩어진 정도를 수치로 나타낸 것을 산포도라 하고 산포도에는 편차, 평균펀차, 분산, 표준편차가 있고 식으로 정리하면 다음과 같다.

  • $(편차\;)=(변량\;)-(평균\;)$
  • $(분산\;)=(편차\;)^2\;$의 평균
  • $(표준편차\;)=\sqrt{(분산\;)}$