ANOVA
확률과 통계
여러 모집단의 평균 비교
- 여러 모집단에 대해 t검정을 2개씩 하면 α가 커져서 원하는 유의수준에 대한 가설검정이 어려움.
- \(t(n_1 + n_2 - 2)^2 = F(1, n_1 + n_2 -2)\)
분산분석 (ANOVA)
- 요인, 인자 (factor): class
- 수준 (level): class 값
- 처리 (treatment): 요인과 수준의 조합
- 반응치 (response): 관측치
완전 확률화 계획법(Completely Randomized Design)
- 일원 분산분석이 공정한 결과를 내기 위한 실험 조건
- 처리 i에 해당되는 모집단으로부터 독립인 표본 \(n_i\)개를 랜덤으로 샘플링함으로써, k개의 서로 다른 모집단으로부터 독립인 random sample들을 얻는 것과 같음
- 반복 수가 같을 필요는 없다
- 각 모집단으로부터 랜덤으로 표본을 추출하는 것
- == 실험 대상을 랜덤으로 그룹으로 나눈 후, 각 그룹에 대해 서로 다른 처리를 작용하는 것
일원 분산분석 (One-Way ANOVA)
- 정규성, 독립성, 등분산성
- → 오차의 독, 정, 불편성, 등분산성
- 오차(표본 - 잔차): 관심 없는 다른 모든 요인에 의해 발생하는 오차
- 효과: \(τ_i: μ_i - μ\)
- \(Y_{ij} = μ + τ_i + ε_{ij}\)
- \(Y_{ij} - \bar{Y} = (\bar{Y_i} - \bar{Y}) + (Y_{ij} - \bar{Y_i})\)
사후 검정 (Post-Hoc Test)
- f검정 결과 \(H_0\)가 기각되는 경우 어떤 처리 사이에 차이가 있는지 검정해야 함.
- \(T_0 = \frac{\bar{Y}_i - \bar{Y}_j}{\sqrt{MS_E}\sqrt{\frac{1}{n_i} + \frac{1}{n_j}}} ~ t(n-k)\)
- bonferroni 방법: α를 검정 횟수 m으로 나눈 \(\frac{\alpha}{m}\)으로 사용
- 이는 매우 보수적인 검정 방법. f 검정시 \(H_0\)를 기각해도, 사후 검정에서 \(H_0\)를 기각 못할 수도 있음
무작위 블록 계획법 (Randomized Block Design)
- 처리 외 독립적으로 영향을 미치는 변수의 변동을 분석하기 위해, 각 요인을 처리 모두에 대해 관찰하는 것
- 이때 처리의 순서는 random
- \(SS_T = SS_A + SS_B + SS_E\)
Randomized Block Design에서의 분산분석
- 사후 검정: 자유도가 n - b - k + 1