통계적 가설검정

확률과 통계
공개

2025년 3월 27일

통계적 검정

  1. 가설 수립
  2. 표본 추출
  3. 통계량 계산
  4. 가설 채택 / 기각

가설검정

  • 귀무가설(\(H_0\)): α의 값을 상한으로 지정하고 보수적으로 고려

  • 대립가설(\(H_1\))

  • 검정 통계량: \(H_0\)가 참이라고 가정했을 때, 표본에서 계산된 통계량

  • 기각역: \(H_0\)를 기각할 수 있는 범위

  • Type 1 error를 보통 보수적으로 지정하기 때문에 Type 2 error는 높아진다. (상충 관계)

    • 둘 다 줄이고 싶다면 n을 늘려야 한다.
    • 일반적으로 α(Type 1 error)를 고정하고 원하는 β(Type 2 error)를 만족하는 표본의 크기를 결정한다.
  • 상단측 검정

  • 하단측 검정

  • 양측 검정

→ 기각역 계산에 주의하자

모비율 차이 검정

  • \(\frac{(\hat{p}_1 - \hat{p}_2) - D_0}{\sqrt{\hat{p}(1-\hat{p})(\frac{1}{n_1} + \frac{1}{n_2})}}\)
  • \(\hat{p} = \frac{x_1 + x_2}{n_1 + n_2}\)

β 계산

\(H_0\)를 이용해 검정 통계량을 계산하고, 이를 이용해 기각역을 구한 후, \(H_1\)을 이용해 계산.

대표본 단측 가설검정 표본 크기1

  • \(n = \frac{(z_{1 - \alpha} + z_{1 - \beta})^2\sigma^2}{(\mu_1 - \mu_2)^2}\)

가설 검정 절차와 신뢰구간의 관계

  • \(\hat{θ} - z_{1-α/2}σ_{\hat{θ}} ≤ θ_0 ≤ \hat{θ} + z_{1-α/2}σ_{\hat{θ}}\)
  • 100(1-α)% 신뢰구간은 유의수준 α에서 귀무가설 \(H_0: θ = θ_0\)가 채택되는 모든 \(θ_0\) 값의 집합.

p-value

  • p-value: \(H_0\)를 기각시킬 수 있는 가장 작은 유의수준 α의 값 (즉 확률)

소표본 가설검정

  • 쌍체표본: 두 집단이 독립이 아니고 서로 연관되어 있는 경우
    • 각 쌍의 차이를 계산하여 단일 표본으로 변환 후 분석할 수 있습니다.

분산 검정

맨 위로

각주

  1. 양측은?↩︎