오늘은 기술통계 중 대푯값 그리고 산포도에 알아보도록 하겠습니다. 기술통계에서의 대푯값은 중심위치를 나타내는 것으로 분포의 중앙지점 또는 도수의 중앙점과는 일치하지 않지만 대략적으로 측정한 측정치를 의미합니다.
이때 대푯값을 정하는 자료들은 도수분포표로 정리하면 쉽게 파악이 가능합니다. 대푯값을 계산하는 방법을 간략하게 말해보면 산술평균 사분위수 기하평균 최빈수 중위수 조화 평균 평방 평균이 있습니다. 이는 추상적인 대푯값으로 어떤 지점에 많이 분포했는가를 보고자 한다면 산술평균 최빈수 중위수를 사용하면 집중화된 지점을 파악하기에 용이합니다.
계산적인 대푯값이란 추상적인 대푯값이라고도 부르는데 이때는 표본으로 산출하는 것이 아니라 변수 전체를 사용한 후에 계산하는 것으로 변수 중에 어떤 한 개의 변수가 변하면 대푯값에 영향을 미칩니다. 이때 변수의 영향을 많이 받기 때문에 추상적인 대푯값이라고도 부릅니다.
위치적인 대푯값은 통계 집단의 측정값을 크기 순으로 배열한 다음 중앙의 수를 찾는 방법으로 중위수 또는 중앙치라고도 부릅니다. 위치적인 대푯값은 값의 영향을 받지 않는 것이 특징입니다. 분포 모양이 비대칭인 경우에는 중앙값이 자료의 대표성을 높이는 역할을 할 수 있으며 분포 모양이 대칭인 경우에는 산술평균과 중앙값은 일치합니다. 하지만 수리학적으로 다루기가 어려운 분야로 일반적으로는 사용하지 않는 측정방법입니다. 단 경기변동을 산출하거나 관측치의 분포도가 어느 한 지점에 편중되어있을 때 많이 활용합니다.
최빈수는 출현 도수가 많은 값을 말하며 도수 분표 표에서 도수가 많은 계급의 계급 값이 최빈수가 됩니다. 최빈수는 빈도수가 많이 발생한 관찰한 값을 일컫기 때문에 중위수처럼 자료에서 정중앙에 있는 이상점의 영향을 거의 받지 않습니다.
최빈수는 가장 쉽게 알아볼 수 있는 대푯값이기 때문에 관찰대상의 규모를 파악할 때 자주 이용합니다. 분포 모양을 보고 최빈수의 대표성 여부를 파악하는데 좌우 대칭인 경우는 대표성이 있다고 합니다. 경우에 따라는 최빈수가 없을 수도 있으며 두 개 혹은 그 이상일 수도 있습니다. 특히 의류에서 기성복 치수를 재는 경우에 많이 사용되는 값입니다.
다음은 산포도에 대한 소개입니다. 산포도는 자료에서 분산 상황을 나타내는 수치로 분포에서 중심적 위치를 정한 후에 그 주위에 분포한 정도를 나타내는 지표라고 할 수 있습니다. 산포도가 크면 폭이 넓다고 하고 작으면 폭이 줄어듭니다. 산포도에는 절대적 산포도와 상대적 산포도가 있습니다.
산포도를 측정하려면 범위나 표준편차 평균 편차 사분위편차를 사용합니다. 절대적 분포의 산포도에서 범위에 대해 알아보면 이는 가장 간단하게 사용할 수 있는 측정방법으로 자료에서 최댓값 그리고 최솟값의 차이를 의미합니다. 계산하는 방법은 자료에서의 최댓값에서 최솟값을 빼면 측정이 가능합니다. 평균 편차는 평균으로부터 수가 얼마나 떨어져 있는지를 말하는 것입니다. 평균 편차는 수학적으로 복잡하게 처리된다는 것과 이용도가 낮다는 점 때문에 자주 사용하지는 않습니다.
상대적인 산포도에서는 변이 계수라는 것이 있는데 이는 변동 계수라고도 부릅니다. 추정 통계학에서는 변이 계수를 표본 크기를 설정할 때 씁니다. 적률은 분포의 특성 값을 구할 때 사용합니다.
다음은 확률에 대해 간략히 설명하도록 하겠습니다. 확률은 어떤 사건이 일어날지 안 일어날지 확실치 않은 경우 그 가능성에 대해 얘기하는 것으로 0과 1 사이의 수로 표현을 합니다. 확률에서는 일어날 수 있는 모든 가능성을 표본이라고 합니다. 각각의 원소들을 표본점이라고 부르고 표본에서 각 원소들을 부분집합이라고 부릅니다. 부분집합에는 하나만 포함하는 단순 사상과 모든 원소를 포함하는 전체 사상 그리고 어떤 원소도 있지 않은 공사상이 있습니다.
확률분포의 정의는 확률변수의 성격을 말하는 것으로 표본 공간에서의 모든 값 그리고 그 값에 대응하는 확률을 표현한 것을 의미합니다. 여기에서의 기댓값은 어떤 특성치를 의미하며 실험을 계속하여 진행했을 때 기대할 수 있는 값을 말합니다.
'사회조사방법' 카테고리의 다른 글
확률분포 이산확률분포 연속확률분포 정의 (0) | 2021.02.22 |
---|---|
사회조사 통계분석 방법 교차분석과 분산분석 (0) | 2021.02.20 |
사회조사 가설 요소 및 검정절차 요소 및 절차 (0) | 2021.02.20 |
사회조사 분산분석 정의 및 종류 (0) | 2021.02.15 |
자료를 정리하는 방법을 알아보겠습니다. (0) | 2021.02.10 |