ANOVA

확률과 통계

공개

2025년 4월 15일

여러 모집단의 평균 비교

여러 모집단에 대해 t검정을 2개씩 하면 α가 커져서 원하는 유의수준에 대한 가설검정이 어려움.
\(t(n_1 + n_2 - 2)^2 = F(1, n_1 + n_2 -2)\)

분산분석 (ANOVA)

요인, 인자 (factor): class
수준 (level): class 값
처리 (treatment): 요인과 수준의 조합
반응치 (response): 관측치

완전 확률화 계획법(Completely Randomized Design)

일원 분산분석이 공정한 결과를 내기 위한 실험 조건
처리 i에 해당되는 모집단으로부터 독립인 표본 \(n_i\)개를 랜덤으로 샘플링함으로써, k개의 서로 다른 모집단으로부터 독립인 random sample들을 얻는 것과 같음
반복 수가 같을 필요는 없다
각 모집단으로부터 랜덤으로 표본을 추출하는 것
== 실험 대상을 랜덤으로 그룹으로 나눈 후, 각 그룹에 대해 서로 다른 처리를 작용하는 것

일원 분산분석 (One-Way ANOVA)

정규성, 독립성, 등분산성
- → 오차의 독, 정, 불편성, 등분산성
- 오차(표본 - 잔차): 관심 없는 다른 모든 요인에 의해 발생하는 오차
- 효과: \(τ_i: μ_i - μ\)
\(Y_{ij} = μ + τ_i + ε_{ij}\)
\(Y_{ij} - \bar{Y} = (\bar{Y_i} - \bar{Y}) + (Y_{ij} - \bar{Y_i})\)

사후 검정 (Post-Hoc Test)

f검정 결과 \(H_0\)가 기각되는 경우 어떤 처리 사이에 차이가 있는지 검정해야 함.
\(T_0 = \frac{\bar{Y}_i - \bar{Y}_j}{\sqrt{MS_E}\sqrt{\frac{1}{n_i} + \frac{1}{n_j}}} ~ t(n-k)\)
bonferroni 방법: α를 검정 횟수 m으로 나눈 \(\frac{\alpha}{m}\)으로 사용
- 이는 매우 보수적인 검정 방법. f 검정시 \(H_0\)를 기각해도, 사후 검정에서 \(H_0\)를 기각 못할 수도 있음

무작위 블록 계획법 (Randomized Block Design)

처리 외 독립적으로 영향을 미치는 변수의 변동을 분석하기 위해, 각 요인을 처리 모두에 대해 관찰하는 것
이때 처리의 순서는 random
\(SS_T = SS_A + SS_B + SS_E\)

Randomized Block Design에서의 분산분석

사후 검정: 자유도가 n - b - k + 1