사회조사방법

확률분포 이산확률분포 연속확률분포 정의

Peanut butter 2021. 2. 22. 18:53

 

확률분포란 확률변수의 성격을 의미하는 것으로 표본 공간에서의 모든 값과 그 값에 대응하는 확률을 표현한 것을 일컫습니다. 실험을 지속적으로 진행했을 때 일반적으로 기대할 수 있는 값을 확률분포의 기댓값이라고 합니다.

 

확률 번수에서 산포도를 나타내는 것이 분산과 표준편차입니다. 확률분포에서 분산은 확률변수의 값이 기대치로부터 얼마나 떨어져 있는가를 의미합니다. 확률분포에서 표준편차는 확률변수 값의 분산에 제곱근을 한 것을 말합니다.

 

 

확률분포에는 이산 분포 연속 분포가 있습니다. 이산 분포는 확률변수가 정수인 경우로 초기한 분포 다항 분포 포아송 분포가 있습니다. 연속 확률분포는 정규분포 표준 정규분포가 있습니다. 

 

이산 확률분포는 어떤 변수가 실험이나 관찰했을 때 나타날 수 있는 모든 상황을 말하며 각 상황이 발생할 수 있는 확률을 수치화한 것입니다. 이때 확률분포 모양은 종류에 따라 달라지며 이산 변수인 경우에 이산 확률분포라고 합니다. 이산 확률분포에는 이항 분포가 있는데 이항 확률변수는 확률 실험에서 나타날 수 있는 기본 결과가 두 가지인 경우를 말하며 확률 실험에서 어떤 결과가 나오는 수를 변숫값으로 했을 때 이항 확률변수라고 합니다. 이항 확률분포는 특정한 확률분포를 갖게 되었을 때 그 분포 자체를 일컫는 말입니다.

 

포아송 분포는 이항 분포가 주어졌을 때 시행한 횟수 중 사건 횟수에 적용되는 분포라면 포아송은 단위 시간당 사건 발생 횟수에 적용되는 분포입니다. 포아송 분포가 성립되기 위해서는 독립성 비 집락 성 비례성이 충족되어야 합니다. 독립성은 일정 시간 동안 일어나는 사건 횟수를 말하고 비례 써은 짧은 시간 동안 사건이 발생할 시간의 길이나 면적을 말합니다. 비 집락 성은 짧은 시간 동안 두 번 이상 사건이 발생할 확률이 작다는 것을 의미합니다.

 

초기하 분포는 성공할 확률이 일정한 경우를 제외한 나머지에서 활용합니다. 유한 모집단의 크기가 추출 개수보다 클 때 초기하 분포를 이항 분포로 접근합니다.

 

기하 분포는 성공을 위해 실패가 필요한 경우 활용하는 것이며 음이항 분포는 성공확률의 수치를 정한 다음 이를 반복 시행을 몇 번 해야 성공했는가를 알아보는 것입니다.

 

 

다음은 연속확률분포입니다. 연속 확률분포는 어떤 전형적인 분포의 유형을 말하며 가우스 분포라고도 부릅니다. 정규분포는 연속 확률분포의 대표적인 분포이며 가장 많이 사용됩니다. 정규분포의 경우는 평균 그리고 표준편차가 모양과 위치를 선정합니다. 대칭적인 종모양을 하는 것이 특징이며 이항 분포의 확률 근사치와 같은 경우 이를 계산하는데 적합합니다. 

 

표준 정규분포의 경우 평균 그리고 표준편차에 따라 모양 그리고 위치가 달라지는데 서로 다른 두 정규분포의 성격을 비교할 때나 그 확률을 계산하기 위해서 필요한 것입니다. 지수 분포는 어떤 시간이 지속되었는지를 파악할 때 적합한 분포로 모두 사건 발생 간의 관계를 파악하는데 용이합니다.

 

표본 분포의 경우 연구를 진행하는데 어려운 점 때문에 모집단에서 표본을 추출한 다음 계산된 통계량을 모집단의 모수를 통해 추출하는 것을 말합니다. 모집단에서 채택되면 일정한 크기를 기반으로 분석한 결과가 나오는데 이때 표본의 크기는 모집단의 크기에 영향을 받고 표본의 크기가 크면 표준오차가 작아집니다.

 

 

모집단과 표본은 모집단에 속하는 개체들의 수를 모집단의 크기라 칭하고 모집단을 구성하는 각각의 개체의 총합을 표본의 크기라고 부릅니다.

 

모집단의 개체를 조사할 때 전부다 조사하는 것을 전수조사라 하고 일부를 조사하는 것을 표본조사라고 합니다. 이때 표본추출은 유의 표본추출법과 확률 표본추출법이라는 두 가지 방법으로 진행합니다. 이때 오차도 고려해야 하는데 오차는 측정도구가 불안정한 경우 생길 수 있는 오차를 말하고 계통 오차 또는 임의 오차라고도 부릅니다. 표본오차를 구하는 방법은 모집단과 표본의 차이를 구하면 됩니다.

 

표본 분포의 평균을 구하는 방법은 모든 표본에서 계산된 평균의 확률분포를 구하면 됩니다. 표 본평 군의 표본 분포는 정규분포를 이루고 통계량에서 표준편차를 사용한 통계량의 표준오차라고도 부릅니다. 표준오차는 언제나 모집단의 표본 편차보다 작다는 특징을 갖고 있습니다.