Hypothesis Testing

귀무가설, 유의수준, 검정통계량, 기각/채택

추론통계는 표본에서 모집단의 모수를 추정하는 사전 분석 과정과 추정한 결과가 신뢰할만한 것인지 검정하는 사후 분석 과정으로 구분한다

사전분석에서 모집단의 모수를 추정하는 방법으로 점추정(point estimation)과 구간추정(interval estimation)이 있다. 점추정은 모수를 한 개의 값으로 추정하는 방법이고, 구간추정은 모수가 포함되리라 기대되는 구간으로 모수를 추정하는 방법이다. 대표적으로 신뢰구간이 있다.

가설검정

사후 분석은 모집단에 대한 가설을 세우고, 표본 통계량에 기초하여 검증하는 가설검정 과정이다. 가설을 세울 때 일단 귀무가설이 사실이라고 가정한다. 만약 그에 반하는 증거가 충분히 있으면 귀무가설을 기각하고 대립가설을 채택한다. 가설검증은 대립가설의 성격에 따라 단측검정(One-sided Test), 양측검정(Two-sided Test)을 구분한다.

귀무가설은 "차이가 없다." 같은 보수적인 주장이다.

예) 모든 그룹의 평균이 같다, 데이터가 정규분포 가정을 만족한다

대립가설은 "차이가 있다." 적극적으로 입증하려는 주장이다.

예) 모든 그룹이 평균이 같은 것은 아니다. 데이터가 정규분포 가정을 만족하지 않는다

검정통계량과 P-Value

검정통계량

가설을 검정할 목적으로 사용하는 표본 통계량으로 귀무가설이 참이라는 가정하에 산출한다. 검정통계량은 확률분포를 따르도록 설계되었다.

예) 표본평균, 표본분산, t값, z값, F분포가 검정통계량이다.

P-Value (Probability Value)

검정 통계량으로 계산한 값이다. 특이함 정도를 표현(특이도)하며, 데이터가 특이할수록(대립가설에 가까울수록) P-Value가 작아진다.

오류와 유의수준

유의수준(significance level) 유의수준은 1종 오류의 한계 허용치이다. 1종 오류는 귀무가설이 옳은데 기각하고 대립가설을 채택하는 경우이다.

임계값(Critical Value) 주어진 유의수준에서 귀무가설의 채택과 기각에 관한 의사결정을 할 경우, 그 기준이 되는 값이다.

기각/채택 판단

유의수준은 0.05로 잡는 경우가 많다. P-Value < 유의수준(보통 0.05)이면, 귀무가설 기각한다. (평범하다 vs 특이하다 기준)

가설검정 절차

1. 가설을 설정하고, 가설을 검정할 검정통계를 선정한다. 2. 귀무가설을 기각할 유의수준과 기각역을 정한다. 3. 검정통계량을 산출하고 p-value를 찾는다. 4. 결과가 기각역 안에 들어오는지 확인하고 기각/채택 판단한다.

기타

1종 오류 귀무가설이 실제로 참이지만, 귀무가설을 기각하는 오류

2종 오류 귀무가설이 실제로 거짓이지만, 귀무가설을 채택하는 오류

1종 오류와 2종 오류 중 어떤 오류가 더 위험할까?

약품 비교 예 귀무가설은 두 약품의 효과가 동일하다. 대립가설은 두 약품의 효과가 동일하지 않다.

두 약품이 같지만 다르다고 판단할 경우 1종오류 두 약품이 다르지만 같다고 판단할 경우 2종 오류 이 경우 2종 오류가 잠재적으로 생명에 위협이 될 수 있어 더 위험 할 수 있다.

임계값 귀무가설을 기각하는 기준이 되는 값

기각역 기각치를 중심으로 귀무가설을 기각시키는 범위

유의수준 귀무가설이 의심스러운 확률 수준, 통상 0.01, 0.05 (1%, 5%)

참고자료

http://www.ktword.co.kr/test/view/view.php?no=1784 http://www.ktword.co.kr/test/view/view.php?m_temp1=5827&id=603

Last updated