가설검정의 정체에 대한 이야기 편에서 약속한 귀무가설, 대립가설 설정 방법에 관한 이야기의 계속.
일단, 마구 섞어쓰는 용어에 대해서 먼저 이야기한다면, Null Hypothesis는 귀무가설, Alternative Hypothesis는 대립가설입니다. 통계에서는 정말 마구 섞어 써야 하는 용어가 많아서 이렇게 트레이닝을 계속하다 보면 공기처럼 그냥 그건 그거지 하고 머릿속에서 섞여서 같은 것으로 뒹굴게 된다고 생각합니다. 이것 밖에는 어쩔 도리가 없지 않은가라는 생각도 물론 하고 있습니다.
가설검정은 관심을 가지고 있는 모집단에 대한 가설을 세우고, 표본을 뽑아서 표본정보로부터 그 가설들을 검증하는 것을 의미합니다. 가설검정도 확률로 예측하는 과정이라고 보면 됩니다.라고 했지만, 이 또한 쉽지만은 않습니다.
가장 어려운 점을 얘기하자면, 가설검정을 하기 위해서는 Null Hypothesis(귀무가설, H0), Alternative Hypothesis(대립가설, H1)이라는 걸 설정해야 되는데, 이 용어가 검정에 관한 모든 것을 헷갈리게 하는 시발점이 된다고 생각합니다.
Null Hypothesis하면 무엇이 생각나는가 하면 void입니다. 아무것도 아니다 nothing. 귀무가설하면 무엇인 생각나는가 하면 아무 생각이 들지 않는 무념무상의 상태로 돌아감입니다. 그렇다면 Alternative Hyothesis하면 대안이라는 용어가 떠오르는데, 사실 이것도 잘 모르겠습니다. 그러면 대립가설이라고 하면 뭐가 떠오르는가? 하면 싸우는 가설인가? 정도밖에 감이 오지 않습니다. 전혀 모르겠습니다. NULL Hypothesis는 Nullify Hypothesis 즉, Alternative Hypothesis를 무효화한다는 뜻이라면 이런 의미만으로 해석해서 귀무가설이라는 단어는 그다지 틀리지 않긴 합니다만. 그래도, 여전히 이상하고 잘 모르겠습니다. 이런 용어라면 한참 동안이나 이리저리 생각해 보지 않고서는 결론이 나오지 않고, 결론이 나왔다 하더라도 번번이 틀리기 일쑤입니다.
사실 가만히 살펴보면 Null Hypothesis의 Null은 아무것도 아닌것의 Null을 의미한다기보다는 Default의 의미이고, 그러니까 귀무가설은 없는 것으로 돌아간다는 의미보다는 Default로 돌아간다는 의미인데, 어찌 보면 아무것도 한 게 없는 것으로 돌아간다. 는 의미를 내포하는 것 같습니다만, 아니 왜 이렇게 불러야 하는지 그 이유를 당최 모르겠다는 사실. 그리고, Alternative Hypothesis 역시도 어쨌든 Null이 아니라면 채택해야 하는 가설이라는 느낌적인 느낌이 있습니다. 그나마 Null Hypothesis보다는 이름을 조금은 더 직관적으로 지었다는 개인적인 감상입니다.
귀무가설과 대립가설이라는 말에 있어서 흔히 우리가 대립가설을 연구가설이라고 생각하는 경향이 있는데, 우리가 증명하려는 것이 대립가설 이라는 전제이어야 맞는 말입니다. 지금 관측한 것이 의미가 없네?로 귀무가설을 기각하지 못함, 어? 의미가 있네? 귀무가설은 버리고, 대립가설 OK라는 스토리입니다. 그러면 대립가설이 채택되었을 때, 유의하다는 의미도 매우 적절한 표현이 됩니다. 그러면 흔히들 이야기하는 무죄추정의 원칙-유의하지 않을 것이 기본 가정이지만, 유의할 것이라는 것을 증명하려는 것-도 그런대로 말이 됩니다. 그렇지만 우리가 주의해야 할 것은 통계에서 유의하다(Significant)는 의미가 있다는 그런 의미 보다는 관측된 값이 상당하다는 말입니다. 이 모든 것이 대립가설을 우리가 증명하고 싶은 가설이라고 설명하는데에서 부터 시작되는 오해입니다. 그러니까 그런 식의 매칭은 잊는 것이 상책입니다.
여기에서 우리 귀무의 돌아간다는 "귀"의 의미를 조금은 잊어버리고 접근하면 조금 더 쉽지 않을까 생각합니다. Null Hypothesis는 우리가 어떤 확률분포를 그렇다 치고(가정하고), 그 조건에서 그 확률분포에 따라 어떤 관측이 완전 무작위로 관측될 것이다라는 가설입니다. 그러니까 여기에서 Null은 우리가 그렇다고 친 (가정한) 확률분포 그대로 날것인 상태에서 무작위로 데이터가 관측될 것이라는 의미로 생각하면 어떨까 합니다. 그렇다면, Alternative Hypothesis는 관찰해 보니 그렇다고 치자라는 마음으로 가정한 확률분포가 맞긴 맞나? 아니지 않나? 하는 가설이라고 보면 그런대로 이해하기 좋은 해석이라고 생각합니다. 그러니까 여기에서도 꼭 가슴에 품어야 할 사실은 Null Hypothesis가 확률분포를 그렇다~치고~라는 형식으로 가정했을 뿐이지 이 가설이 실제로 꼭 True라는 것은 아니라는 점입니다.
그러니까, 두개의 가설을 세우고 나면, 통계적인 유의성(Significance)과 p값이 등장하게 되는데, 예를 들어 어떤 실험을 통해 얻은 그룹 간의 차이가 무작위로 발생할 수 있는 합리적인 수준보다 더 극단적으로 다르다면, 두 그룹의 차이가 우연히 나온 것은 아니지 않나? 하는 접근을 하게 되는데, 그때 판단 기준이 유의 수준과 p value라는 것입니다. 그러니까, 결과적으로 가설검정은 관측 결과가 우연에 의한 것인지를 판별하여, 무작위로 발생한 사건을 의미 있는 패턴으로 오해하지 않고, 속지 않도록 하기 위한 방법이라고 볼 수도 있겠습니다.
어쨌든 이 용어에 익숙해 지는데 오래 걸렸고, 어떻게 가설을 설정해야 하는지도 마냥 외웠었다고 솔직하게 고백합니다. 용서해 주세요. 이제는 외우지 말고 가설을 설정하는 원리를 알아 하겠는데 말이죠, Null Hypothesis(귀무가설)와 Alternative Hypothesis(대립가설)을 설정하는 방법은 생각보다 매우 간단합니다.
귀무가설은 정확하게 어떠한 확률분포를 가정하고 그것이 그렇다 치고~ 라고 표현할 수 있는 가설이라고 했는데요. 무슨 말이냐면, 모수를 가정해서, 그 가정에 의한 확률 분포를 가정할 수 있는 가설입니다. 그리고, 대립가설은 실체가 없습니다. 그냥 귀무가설이 기각되면 자연히 채택되는 가설이라고 생각하면 편리합니다. 귀무가설의 경우에는 너무나도 당연한 것이 분포를 설명할 수 있어야 우연히 일어난 일인지 검정을 할 수 있으니까 그렇습니다. 그러니까 당연하게도 대립가설은 검정의 대상이 아닙니다. 사실 이런 저의 주장을 마음에 들어 하지 않을 분들이 많이 있을 수 있겠지만, 부디 넓은 아량으로 봐주십사 하는 마음을 정중하게 표합니다.
자, 그러면 가설을 구분해 봅시다.
$\mu=100 \cdots$ (1)
$\mu\neq100 \cdots$ (2)
이라는 두개의 가설이 있다고 칩시다. 그러면 σ를 안다는 가정 아래 주어진 평균으로 분포를 그렇다 치고라고 표현할 수 있는 가설은 어떤 것일까요? 당연히 (1)입니다. (2) 가설로 어떤 분포를 표현할 수 있을까요? 없습니다. 그냥 실체가 없고, (1)을 부정할 뿐입니다. (1)이 Null Hypothesis가 되어야 하겠습니다. 참고로 검정을 할 때는 양측검정을 하게 되겠습니다.
또 볼까요?
$\mu\geq 100 \cdots$ (3)
$\mu\lt100 \cdots$ (4)
그러면 이 경우는 어떤가요? 마찬가지로 (3)은 =을 이용해서 분포를 가정하고, 그 가정한 분포에서 $\mu \gt 100$을 기본 채택역으로 정해서 할 수 있지만 - $\mu\lt 100$ 영역에 기각역이 있도록 - , (4)는 아무것도 표현할 수 없습니다. 그러니까 (3)이 Null Hypothesis 입니다. 이런 식입죠. 참고로 이런 식의 Null Hypothesis를 검정 할 때는 단측검정을 하게 됩니다.
"뭐야, 꽤 간단하잖아?"
잠시 (1)(2)와 (3)(4)의 차이를 본다면, (1)(2)는 양측검정을 하게 되는데, 기각역은 5%에서 2.5%씩 나누게 되고, (3)(4)는 단측검정으로서 한쪽에 5%의 기각역을 갖게 됩니다.
보통 통용되는 Null Hypothesis와 Alternative Hypothesis의 정의에 대한 주장을 살펴보고, 왜 그렇게 표현했는지를 살펴보도록 하겠습니다. 보통 귀무가설을 설정할 떄 다음과 같은 공식으로 설정한다는 주장들이 있습니다.
귀무가설 : 같다, 차이가 없다. 효과가 없다.
대립가설 : 다르다, 차이가 있다. 효과가 있다.
등으로 귀무가설과 대립가설을 설정한다는 접근도 있습니다. 이 접근이 막연히 유용한 이유는 다음과 같습니다. 예를 들어 평균으로 같은지, 차이가 있는지, 효과가 있는지를 판단한다고 해 보시죠.
두 개의 샘플이 있다면
$\mu_1 = \mu_2$ 인가, $\mu_1 \neq \mu_2$ 인가를 따지는 것이겠죠.
자, 그러면 이걸 조금 변형하면
$\mu_1 - \mu_2 = 0 \cdots$(5)
인가, 아니면
$\mu_1 - \mu_2 \neq 0 \cdots$(6) 를 따지는 것과 같겠죠.
지금 이 순간 분포를 그래 그렇다고 치고 따질 수 있는 가설은 어떤 것인가 생각해 보면 당연히 (5)입니다. 두 개의 분포에서 평균의 차이가 0인 경우에는 분포를 가정해서 나타낼 수 있습니다. 즉 $X_1 - X_2$의 분포를 구해서 검정할 수 있다는 의미입니다. 두 개의 분포가 다르다는 것은 분포로 나타낼 수 없습니다.
하지만, 항상 우리를 헷갈리게 하는 가설들에 대한 정의가 있는데 다음과 같습니다. - 이런 주장들은 귀무가설과 대립가설에 대하여 공부할 때 너무나 헷갈리게 하므로 동의하지 못하는 정의입니다. -
① 귀무가설은 검정전과 검정 후가 다르지 않은 것을 귀무가설로 한다. 그러니까, 의미 없는 행위를 하는 것이므로 귀무가설은 기각되는 것이 좋다. (X)
② 귀무가설이란 관습적이고 보수적인 주장, 차이가 없다, 0이다 등의 연구자가 타파하고자 하는 주장을 말하고, 대립가설이란 우리가 적극적으로 입증하려는 주장, 차이가 있음을 통계적 근거를 통해 입증하고자 하는 주장을 말한다. (X)
③ 귀무가설은 무죄추정의 원칙을 의미한다. 그러니까, 연구자가 유죄를 주장하여 본인의 주장이 맞다고 주장하는 가설이 대립가설인 것이다. (X)
④ 귀무가설이란 직접 검증의 대상이 되는 가설로 연구자가 부정하고자 하는 가설이고, 대립가설이란 귀무가설에 반대되는 사실로 연구자가 주장하고자 하는 가설이다. (X)
⑤ 연구자는 귀무가설을 기각하고 싶어한다 (X)
⑥ 귀무가설은 우리가 증명하고자 하는 가설의 반대되는 가설, 효과와 차이가 없는 가설을 의미하며 우리가 증명 또는 입증하고자 하는 가설, 효과와 차이가 있는 가설을 대립가설이라고 한다. (X)
⑦ 일반적으로 믿어지는 사실을 귀무가설로 설정하고, 그것을 부정하는 가설을 대립가설로 설정한다. (X)
이런 식의 정의라면, 우리의 연구는 모두 같지 않다 등을 증명하려고 하는 꼴이 되어 버립니다. 하지만 귀무가설이 옳다는 것을 증명하고 싶을 때도 있습니다. 그러니까 우리의 의도와 상관없이 귀무가설과 대립가설이 정해져야 됩니다.
다시 말하면, '증명하려는 명제'가 귀무가설, 대립가설을 정하는 것과 전혀 관계가 없습니다. - 물론 이것은 통계에 한정된 이야기입니다. 법 분야나 다른 분야에서는 위의 정의처럼 주장할 수 있다고 생각합니다. - 어떨 때는 귀무가설이 입증되었으면 할 때가 있고, 어떨 때는 대립가설이 입증되었으면 할 때가 있습니다.
귀무가설이 맞다고 주장하고 싶은 경우에는 내 실험이 잘 되었다 가 될 수도 있고, 귀무가설이 틀리다라고 주장하고 싶은 경우에는 나의 새로운 가설이 맞지 않을까? 하고 주장할 수도 있겠네요.
p value가 매우 작은 경우에 significant(유의하다, 유의미)라는 표현을 쓰기 때문에 이런 일이 벌어진다고 했잖아요? 그러니까, 이 스토리에 맞추기 위해 오죽하면 p value가 크면 유의미하지 않으니까 무(無)로 돌아간다는 의미에서 귀무가설이라는 뜻을 쓰겠습니까. 이런 식의 용어를 쓰니까, 연구자가 증명하고 싶은 가설이 대립가설이라고 생각하게 되는데, 계속 헷갈릴 수밖에 없게 됩니다. 굳이 유의하다라는 해석을 하려면 Null이 아니다라는 정도로 해석하는 것이 무리가 없다고 생각할 수밖에 없습니다.
실은 Significant가 유의(미)하다는 라고 해석하면 무엇이 그런지 주어가 없으니까, - 나의 주장이 유의미하다는 뜻으로 받아들여질 수 있으니까 - 헷갈리는 점을 보완하여 Null Hypothesis에 의해 그렇다~ 치고 가정한 확률분포의 조건 아래에서 관측한 데이터가 우연하게 일어난 일치고는 꽤 상당한걸?이라고 해석을 하거나, 관측값이 꽤 상당(Significant)하군! 또는 어? 이거 Null Hypothesis가 참이라고 가정했는데, 이 데이터는 좀 더 들여다볼 필요가 있겠는걸? 정도로 하는 것이 훨씬 덜 오해를 불러일으키지 않을까 하고 생각합니다.
"어, 뭔가 있는데?" 정도 라고 생각하면 좋겠습니다.
검정 얘기까지 더해서 다시 정리하면, 귀무가설은 우리가 분포 등을 가정할 수 있는 가설을 의미하고요, 분포를 가정할 수 있는 가설이 default이고, 어차피 귀무가설이 채택되고, 대립가설이 기각되면 새로운 사실이 전혀 없기 때문에 무로 돌아간다는 의미의 귀무라는 느낌을 사용한 것 같은데, 결국 이게 뭐냐 하면 가정한 분포가 진실이라는 조건 아래 관측치를 이용하여 그 관측치가 일반적인 것이 아님을 증명하여 의미를 부여하는 것인 것입니다. 가정한 분포가 맞다는 가정 아래 뭔가를 관측했더니, 이거는 도저히 귀무가설이 맞다는 가정 아래에서는 우연히 관측될 수 없는 것이니까 유의(우연히 일어난 일은 아니다)하고, 그러니까 귀무가설을 기각한다는 뭐 그런 스토리입니다.
그러니까, p value가 유의수준보다 작으면 이거는 귀무가설이 맞을 때 이런 데이터가 관측될 확률이 매우 작은데도 불구하고 관측되었으니까, 귀무가설을 기각한다. 이렇게 정리하면 좀 더 명확할 듯합니다.
귀무가설이 맞을 것 같으면 귀무가설을 기각하지 못한다 라고 하고, 귀무가설이 맞지 않을 것 같으면 귀무가설을 기각한다라고 검정합니다. 이 표현은 모든 가설검정은 귀무가설 중심으로 이루어진다는 사실을 보입니다. 주의할 점은 검정의 과정에서 귀무가설을 기각하지 못한 경우에도 확률적으로 귀무가설이 틀렸다는 확실한 증거를 찾지 못했다 정도로 해석해야지 귀무가설이 참이라고 확정적인 결론을 내리면 조금 곤란합니다. 이 부분이 p value의 컨셉과 연결됩니다.
p값은 귀무가설을 기각하여 오류를 범할 확률과 같다고 생각할 수 있습니다. 왜냐하면 귀무가설이 참이라고 가정했기 때문이죠. 게다가 귀무가설을 채택한다는 말을 해서는 안되는데 그 이유로는 귀무가설을 채택하여 범할 오류의 확률이 무조건 낮다고 할 수는 없기 때문입니다. 그러니까, p value가 크면 귀무가설을 '기각할 수 없다'고 해야지, '채택한다'고 하면 안 됩니다. 대립가설만 '채택한다'라고 할 수 있겠습니다.
이런 애매한 표현이 조금 답답한 경향이 있고 어쩌라는 말이냐하는 느낌이 있는데, 사실 확률적인 표현이기 때문에 그럴 가능성이 농후하니까, 그렇다고 치자 정도로 받아들여도 괜찮지 않을까 하는 기분이 듭니다. 이전에도 "신뢰수준을 높이면 신뢰구간은 넓어진다. 사기 같은 이야기" 편에서 이야기했지만, 통계는 확실히 틀리지 말자는 보수적인 결론을 내는 뭐 그런 철학이 있기 때문입니다.
한 가지만 상식 차원에서 이야기해 둔다면, 대립가설은 귀무가설이 기각되었을 때 채택되는 가설이기 때문에 귀무가설과 수학적으로 exclusive합니다. 즉, 두 가설의 교집합은 없고 두 가설의 합집합은 전체집합입니다.
댓글