연속 확률 분포는 확률 변수가 연속적인 값을 가질 수 있는 확률 분포를 말합니다. 이때 확률 변수는 어떤 값의 범위 내에서 모든 값을 가질 수 있습니다. 연속 확률 분포는 확률 밀도 함수(PDF, Probability Density Function)로 표현되며, 특정 값에 대한 확률이 아닌, 구간에 대한 확률을 계산합니다.

대표적인 연속 확률 분포

  1. 정규 분포 (Normal Distribution):

    • 정의: 평균을 중심으로 대칭적인 종 모양의 분포를 가지며, 데이터가 평균을 중심으로 퍼져 있는 경우를 모델링합니다.
    • 모수: ( \mu ) (평균), ( \sigma ) (표준 편차)
    • 예시: 성적, 키, 체중 등 자연현상의 많은 변수들이 정규 분포를 따릅니다.
  2. 지수 분포 (Exponential Distribution):

    • 정의: 사건이 일어날 때까지의 대기 시간을 모델링합니다.
    • 모수: ( \lambda ) (단위 시간당 평균 발생 횟수의 역수)
    • 예시: 전화가 걸려오는 시간 간격, 기계의 고장 간격.
  3. 카이제곱 분포 (Chi-Square Distribution):

    • 정의: 정규 분포를 따르는 독립 변수들의 제곱 합으로 나타나는 분포.
    • 모수: 자유도 ( k )
    • 예시: 독립성 검정이나 적합성 검정에 사용됩니다.
  4. 베타 분포 (Beta Distribution):

    • 정의: 0과 1 사이에서 값이 나오는 확률 분포. 주로 베이지안 통계에서 사용됩니다.
    • 모수: ( \alpha ), ( \beta ) (형상 매개변수)
  5. 감마 분포 (Gamma Distribution):

    • 정의: 사건이 ( k )번 일어나기까지의 시간을 모델링합니다.
    • 모수: ( k ) (사건 수), ( \theta ) (단위 시간당 평균 발생 횟수의 역수)

파이썬에서 연속 확률 분포 예제 코드

파이썬의 SciPy 라이브러리와 NumPy, Matplotlib를 이용하여 연속 확률 분포를 시뮬레이션하고 시각화할 수 있습니다. 여기에서는 정규 분포지수 분포의 예를 살펴보겠습니다.

1. 정규 분포 (Normal Distribution) 예제

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# 정규 분포의 평균과 표준 편차 설정
mu = 0   # 평균
sigma = 1  # 표준 편차

# 정규 분포를 따르는 데이터 생성
x = np.linspace(mu - 4*sigma, mu + 4*sigma, 1000)
pdf = norm.pdf(x, mu, sigma)

# 그래프 그리기
plt.plot(x, pdf, label=f'Normal Distribution (mu={mu}, sigma={sigma})')
plt.title('Normal Distribution')
plt.xlabel('x')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.show()

이 코드는 평균이 0이고 표준 편차가 1인 정규 분포를 그립니다. norm.pdf 함수는 정규 분포의 확률 밀도 함수를 계산합니다.

2. 지수 분포 (Exponential Distribution) 예제

from scipy.stats import expon

# 지수 분포의 모수 설정 (λ=1.5)
lambda_param = 1.5

# 지수 분포를 따르는 데이터 생성
x = np.linspace(0, 4, 1000)
pdf = expon.pdf(x, scale=1/lambda_param)

# 그래프 그리기
plt.plot(x, pdf, label=f'Exponential Distribution (lambda={lambda_param})')
plt.title('Exponential Distribution')
plt.xlabel('x')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.show()

이 코드는 ( \lambda = 1.5 )인 지수 분포를 그립니다. expon.pdf 함수는 지수 분포의 확률 밀도 함수를 계산합니다.


각 분포에서의 사용 사례

  1. 정규 분포는 자연현상, 금융, 성적 분포 등에서 자주 등장하며, 많은 데이터가 평균 근처에 몰리는 경향을 보입니다.
  2. 지수 분포는 대기 시간, 고장 시간 분석 등에 유용하며, 사건이 발생하는 시간 간격을 모델링할 때 사용됩니다.

이 외에도 SciPy 라이브러리를 통해 다양한 연속 확률 분포를 간단히 다룰 수 있습니다.

+ Recent posts