stack overflow란?

while(alive){ code();

통계

ANOVA 분산분석

나가니 2024. 4. 12. 17:13

ANOVA

두모집단 평균 비교는 2 sample t-test를 사용함,

3개 이상의 모집단 평균 비교하는 가설검증 방법론 : ANOVA

k populations = k levels(treatments)

 

H0 : u1 = u2 = u3

H1 : 적어도 2개 factor level이 다르다.

 

F-test로 가설검증

 

One way ANOVA

 

 

점 추정량 (Point Estimator)

변동 (Variation) : 편차의 제곱의 합 (Sum of Squres of Deviation, SS)

Sum of Square - 변동성의 척도

SSA : 레벨간 차이 (군간 차이, between)

 

SSE : 레벨내 차이 (군내 차이, within)

 

SST,SSA,SSE는 카이제곱분포를 따름

MS값은 카이제곱분포를 따른다

 

검정통계량 F

F >1 이면 귀무가설 기각, level간 평균이 같지 않다 : 군간 변동이 군내 변동보다 크다.

F < 1이면 귀무가설 채택, level간 평균이 같다 : 군내 변동이 군간변동보다 크다.

 

ANOVA Table

F>1이고 P-value < 0.05 이기에 귀무가설 기각, 3 level 평균은 다르다.

ANOVA는 양측검정이다. two-sided test