연속 확률 분포는 확률 변수가 연속적인 값을 가질 수 있는 확률 분포를 말합니다. 이때 확률 변수는 어떤 값의 범위 내에서 모든 값을 가질 수 있습니다. 연속 확률 분포는 확률 밀도 함수(PDF, Probability Density Function)로 표현되며, 특정 값에 대한 확률이 아닌, 구간에 대한 확률을 계산합니다.
대표적인 연속 확률 분포
정규 분포 (Normal Distribution):
- 정의: 평균을 중심으로 대칭적인 종 모양의 분포를 가지며, 데이터가 평균을 중심으로 퍼져 있는 경우를 모델링합니다.
- 모수: ( \mu ) (평균), ( \sigma ) (표준 편차)
- 예시: 성적, 키, 체중 등 자연현상의 많은 변수들이 정규 분포를 따릅니다.
지수 분포 (Exponential Distribution):
- 정의: 사건이 일어날 때까지의 대기 시간을 모델링합니다.
- 모수: ( \lambda ) (단위 시간당 평균 발생 횟수의 역수)
- 예시: 전화가 걸려오는 시간 간격, 기계의 고장 간격.
카이제곱 분포 (Chi-Square Distribution):
- 정의: 정규 분포를 따르는 독립 변수들의 제곱 합으로 나타나는 분포.
- 모수: 자유도 ( k )
- 예시: 독립성 검정이나 적합성 검정에 사용됩니다.
베타 분포 (Beta Distribution):
- 정의: 0과 1 사이에서 값이 나오는 확률 분포. 주로 베이지안 통계에서 사용됩니다.
- 모수: ( \alpha ), ( \beta ) (형상 매개변수)
감마 분포 (Gamma Distribution):
- 정의: 사건이 ( k )번 일어나기까지의 시간을 모델링합니다.
- 모수: ( k ) (사건 수), ( \theta ) (단위 시간당 평균 발생 횟수의 역수)
파이썬에서 연속 확률 분포 예제 코드
파이썬의 SciPy 라이브러리와 NumPy, Matplotlib를 이용하여 연속 확률 분포를 시뮬레이션하고 시각화할 수 있습니다. 여기에서는 정규 분포와 지수 분포의 예를 살펴보겠습니다.
1. 정규 분포 (Normal Distribution) 예제
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# 정규 분포의 평균과 표준 편차 설정
mu = 0 # 평균
sigma = 1 # 표준 편차
# 정규 분포를 따르는 데이터 생성
x = np.linspace(mu - 4*sigma, mu + 4*sigma, 1000)
pdf = norm.pdf(x, mu, sigma)
# 그래프 그리기
plt.plot(x, pdf, label=f'Normal Distribution (mu={mu}, sigma={sigma})')
plt.title('Normal Distribution')
plt.xlabel('x')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.show()
이 코드는 평균이 0이고 표준 편차가 1인 정규 분포를 그립니다. norm.pdf
함수는 정규 분포의 확률 밀도 함수를 계산합니다.
2. 지수 분포 (Exponential Distribution) 예제
from scipy.stats import expon
# 지수 분포의 모수 설정 (λ=1.5)
lambda_param = 1.5
# 지수 분포를 따르는 데이터 생성
x = np.linspace(0, 4, 1000)
pdf = expon.pdf(x, scale=1/lambda_param)
# 그래프 그리기
plt.plot(x, pdf, label=f'Exponential Distribution (lambda={lambda_param})')
plt.title('Exponential Distribution')
plt.xlabel('x')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.show()
이 코드는 ( \lambda = 1.5 )인 지수 분포를 그립니다. expon.pdf
함수는 지수 분포의 확률 밀도 함수를 계산합니다.
각 분포에서의 사용 사례
- 정규 분포는 자연현상, 금융, 성적 분포 등에서 자주 등장하며, 많은 데이터가 평균 근처에 몰리는 경향을 보입니다.
- 지수 분포는 대기 시간, 고장 시간 분석 등에 유용하며, 사건이 발생하는 시간 간격을 모델링할 때 사용됩니다.
이 외에도 SciPy 라이브러리를 통해 다양한 연속 확률 분포를 간단히 다룰 수 있습니다.
'확률 분포 생성 및 방법' 카테고리의 다른 글
[확률 분포 생성 및 방법] 확률 분포 클래스 3 (0) | 2024.10.22 |
---|---|
[확률 분포 생성 및 방법] 확률 분포 클래스 2 (0) | 2024.10.20 |
[확률 분포 생성 및 방법] 이산 확률 분포 (0) | 2024.10.17 |
[확률 분포 생성 및 방법] 파이썬 희소행렬 예제 코드 1 (0) | 2024.10.16 |
[확률 분포 생성 및 방법] 확률 분포 클래스 1 (0) | 2024.10.15 |