T test๋?
T test๋ ๋ group๊ฐ์ ์ฐจ์ด๊ฐ ์ผ๋ง๋ "significant"ํ์ง๋ฅผ ์๋ฏธํ๋ค. ์ฆ, ๋ group๊ฐ์ ์ฐจ์ด๊ฐ "์ฐ์ฐํ" ์ผ์ด๋ ์ผ์ผ ํ๋ฅ ์ ์ธก์ ํ ์ ์๋ค. ๋ณดํต ๋ฐ์ดํฐ ์๊ฐ ์ ์ ๊ฒฝ์ฐ์ ์ฌ์ฉํ๋ค.
ํ๋์ ์์๋ ๋ค์๊ณผ ๊ฐ๋ค. ์ ์ฝํ์ฌ์์ ์๋ก์ด ํญ์์ ๋ฅผ ๊ฐ๋ฐํด ์ด๊ฒ์ด ๊ธฐ๋์๋ช ์ ๋ฏธ์น๋ ์ํฅ์ ์กฐ์ฌํ๊ณ ์ถ๋ค๊ณ ํ์. ์ด๋ฌํ ์คํ์ ์งํํ ๋์๋, ํญ์ ๋์กฐ๊ตฐ(placebo ๋ณต์ฉ)์ด ์กด์ฌํ๋ค. ์คํ ๊ฒฐ๊ณผ ๋์กฐ๊ตฐ์ ๊ธฐ๋์๋ช ์ด ํ๊ท ์ ์ผ๋ก 5๋ ์ฆ๊ฐํ๊ณ , ์คํ๊ตฐ(์ค์ ํญ์์ ๋ณต์ฉ)์ ๊ธฐ๋์๋ช ์ด ํ๊ท ์ ์ผ๋ก 6๋ ์ฆ๊ฐํ๋ค๊ณ ํ๋ค๋ฉด, ์ธ๋ป ๋ณด๊ธฐ์๋ ํญ์์ ๊ฐ ์ค์ ๋ก ๊ธฐ๋์๋ช ์ ๋๋ ค์ฃผ๋ ํจ๊ณผ๊ฐ ์์ด ๋ณด์ธ๋ค. ์ค์ ๋ก ์ด๊ฒ์ด ์ฐ์ฐ์ ์ํด ๋ฐ์ํ ์ผ์ธ์ง, ์๋์ง๋ฅผ T test๋ ํ๋ฅ ์ ํตํด ์๋ ค์ค ์ ์๋ค.
T value์ Degrees of Freedom
T test์ ๊ฒฐ๊ณผ๋ก ๋ ๊ฐ์ output์ ์ป๊ฒ ๋๋ค. ํ๋๋ T value (T score)๋ก, ๋ group ๊ฐ์ ์ฐจ์ด์, ๊ฐ group ๋ด๋ถ์ ์ฐจ์ด(variance)์ ๋น์จ๋ก ๊ณ์ฐํ๋ค. T value๊ฐ ํฌ๋ค๋ ๊ฒ์, ๋ group ๊ฐ์ ์ฐจ์ด๊ฐ ํผ์ ์๋ฏธํ๊ณ , T value๊ฐ ์๋ค๋ ๊ฒ์, ๋ group ๊ฐ์ ์ฐจ์ด๊ฐ ์๋ค๋ ๊ฒ์ ์๋ฏธํ๋ค.
๋ค๋ฅธ ํ๋์ output์ Degrees of Freedom์ผ๋ก, ๊ฐ ๋ฐ์ดํฐ์ ๊ฐ๋ค์ ๋ํ ์์ ๋๋ฅผ ์ธก์ ํ๋ค. ๋ณดํต ๋ฐ์ดํฐ ๊ฐ์ ๊ฐ์๋ฅผ ์ด์ฉํด ๊ณ์ฐํ๋ค.
์ด ๋ ๊ฐ์ T distribution table์ ์ด์ฉํ์ฌ ๋ group ๊ฐ์ ์ฐจ์ด๊ฐ ๋จ์ํ ์ฐ์ฐ์ ์ํ ๊ฒ์ธ์ง, ์๋์ง๋ฅผ ํ๋จํ๋ ๋ฐ์ ์ฌ์ฉ๋๋ค.
P value
๊ฐ T value๋ ํ๋์ P value๋ฅผ ๊ฐ๋๋ค. T value์ Degrees of Freedom์ ์ด์ฉํ์ฌ, ๋์ํ๋ P value๋ฅผ T distribution table์์ ์ฐพ์ ์ ์๋ค. P value๋, ์ด๋ ํ sample data๋ก๋ถํฐ ์จ ๊ฒฐ๊ณผ๊ฐ ์ฐ์ฐํ ์ผ์ด๋ฌ์ ํ๋ฅ ์ ์๋ฏธํ๋ค (0% ~ 100%). ๋ฐ๋ผ์ P value๋ ๋ฎ์์๋ก ์ข๋ค(์ฐ์ฐ์ ์ํด ๋ฐ์ํ ์ฌ๊ฑด์ด ์๋, ์ค์ ๋ก ์ธ๊ณผ๊ด๊ณ๊ฐ ์์ด์ ์ผ์ด๋ ์ผ์ด๋ฏ๋ก). ์ผ๋ฐ์ ์ผ๋ก, P value = 0.05 (5%) ์ดํ์ผ ๋ ํด๋น data๊ฐ validํ๋ค๊ณ ๋ณด๋ฉฐ, ์ด ๊ธฐ์ค์น๋ฅผ alpha level / significance level์ด๋ผ๊ณ ํ๋ค. Alpha level์ ๊ฐ์ ์คํ์๊ฐ ๊ฒฐ์ ํ ์ ์๋ค. ๋ง์ฝ alpha level = 0.05๋ก ์ค์ ํ๋ค๋ฉด, ํด๋น ์คํ์ด 95%์ ์ ๋ขฐ๋(confidence)๋ฅผ ๊ฐ๊ณ ์๋ค๊ณ ํด์ํ ์ ์๋ค.
(Optional) Null Hypothesis (๊ท๋ฌด๊ฐ์ค)
(Null Hypothesis์ ๋ํ ๋ด์ฉ์ ๋ชฐ๋ผ๋ T test๋ฅผ ์ดํดํ ์ ์๋ค.) Null hypothesis๋ ๊ธฐ๊ฐํ ๊ฒ์ผ๋ก ์์๋๋ ๊ฐ์ค๋ก, T test ์ธ์๋ ๋ค์ํ ํต๊ณ์ ๊ฒ์ฆ์์ ์ฌ์ฉ๋๋ ๊ฐ๋ ์ด๋ค. T test๋ '๋ group๊ฐ์ ํ๊ท ๊ฐ์ ์ฐจ์ด๊ฐ ์๋ค (๋ group๊ฐ์ ํ๊ท ์ด ๊ฐ๋ค - ($\mu_1 = \mu_2$))'๋ผ๋ null hypothesis๋ฅผ ๊ฒ์ฆํ๋ ๊ณผ์ ์ด๋ค. ๋ง์ฝ P value๊ฐ alpha level๋ณด๋ค ์์ผ๋ฉด null hypothesis๊ฐ ๋ง์ ํ๋ฅ ์ด ๋งค์ฐ ๋ฎ์ ๊ฒ์ผ๋ก ํ๋จ๋์ด null hypothesis๋ฅผ ๊ธฐ๊ฐํ๊ณ , ๋ฐ๋ผ์ ๋ group ๊ฐ์ ํ๊ท ์ฐจ์ด๊ฐ ์ ์๋ฏธํ ๊ฒ์ผ๋ก ํ๋จํ ์ ์๋ค. ๋ฐ๋์ ๊ฒฝ์ฐ, null hypothesis๋ฅผ ์ง์งํ๋ ๊ฒ์ผ๋ก ๋ณธ๋ค. ์ด์ ๋ํ ๋ณด๋ค ์์ธํ ์ค๋ช ์ ์ฌ๊ธฐ(KOR)์ ์ฌ๊ธฐ(ENG)์์ ํ์ธํ ์ ์๋ค.
T test์ ์ข ๋ฅ์ ๊ณ์ฐ๋ฐฉ๋ฒ
T test์๋ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ์ ๋ฐ๋ผ ์ธ ๊ฐ์ง๋ก ๋ถ๋ฅํ ์ ์๋ค. ํ๋๋ Correlated (or Paired) T test๋ก, ๊ฐ์ group์์ ๋์จ ๋ค๋ฅธ data๋ฅผ ๋น๊ตํ๋ค. ์๋ฅผ ๋ค์ด, ํ ๋ช ์ ํผํ์์ ๋ํ ์คํ ์ /ํ์ ์ธก์ ๊ฐ์ ์๊ฐํด๋ณผ ์ ์๋ค. Correlated T test์ ๊ณ์ฐ๋ฐฉ๋ฒ์ ๋ค์๊ณผ ๊ฐ๋ค.
๋ค๋ฅธ ๋ ๊ฐ์ง์ T test๋ ๋ชจ๋ Independent T test์ ์ํ๋ค. ์ด๋ ๋ group์ ๋ฐ์ดํฐ๊ฐ ์๋ก ๋ ๋ฆฝ์ ์ธ ๊ฒฝ์ฐ์ ์ฌ์ฉ๋๋ค. ์๋ฅผ ๋ค์ด, 100๋ช ์ ํผํ์๋ค์ 50๋ช ์ ๋์กฐ๊ตฐ๊ณผ 50๋ช ์ ์คํ๊ตฐ์ผ๋ก ๋๋์ด ์คํํ ๊ฒฝ์ฐ๋ฅผ ์๊ฐํด ๋ณผ ์ ์๋ค.
๊ทธ ์ค ํ๋๋ ๋ group์ sample ์๊ฐ ๋์ผํ๊ฑฐ๋, ๋ group ๊ฐ์ variance๊ฐ ์ ์ฌํ ๋ ์ฌ์ฉ๋ ์ ์๋ Equal Variance (or Pooled) T test์ด๋ค. ๊ณ์ฐ ๋ฐฉ๋ฒ์ ๋ค์๊ณผ ๊ฐ๋ค.
๋ง์ง๋ง type์ Unequal Variance T test์ด๋ค. ๋ group ๊ฐ์ sample ์๊ฐ ๋ค๋ฅด๊ณ , variance๊ฐ ๋ค๋ฅผ ๋ ์ฌ์ฉ๋๋ค. Welch's T test๋ผ๊ณ ๋ ๋ถ๋ฆฌ๋ฉฐ, ๊ณ์ฐ ๋ฐฉ๋ฒ์ ๋ค์๊ณผ ๊ฐ๋ค.
Excel์ ์ด์ฉํ T test
Excel์ T.TEST() ํจ์๋ฅผ ์ด์ฉํ์ฌ T test๋ฅผ ์ํํ ์ ์๋ค. ์ฌ์ฉ๊ตฌ๋ฌธ์ ๋ค์๊ณผ ๊ฐ๋ค.
T.TEST(array1, array2, tails, type)
array1๊ณผ array2์ ๋ํ T test๋ฅผ ์ํํ๋ค. tails๋ T test์ ์ฌ์ฉํ T ๋ถํฌ์ ํ์ชฝ ๋(tail)๋ง ์ฌ์ฉํ ๊ฒ์ธ์ง(๋จ์ธก๊ฒ์ ), ์ ์ชฝ ๋์ ๋ชจ๋ ์ฌ์ฉํ ๊ฒ์ธ์ง(์์ธก๊ฒ์ )์ ๋ํ parameter์ธ๋ฐ, ์ด์ ๋ํ ์์ธํ ์ค๋ช ์ ์ฌ๊ธฐ์์ ํ์ธํ ์ ์๋ค. type์ ์์์ ์ค๋ช ํ, T test์ ์ข ๋ฅ๋ฅผ ์๋ฏธํ๋ค.
- Type=1 : Paired T test
- Type=2 : Equal Variance
- Type=3 : Unequal Variance T test
์ฐธ๊ณ ์๋ฃ
https://www.statisticshowto.com/probability-and-statistics/t-test/
https://www.investopedia.com/terms/t/t-test.asp
'๐ Deep Learning > ํ๊ฐ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Python์ผ๋ก Multiclass sensitivity, specificity ๊ณ์ฐํ๊ธฐ (0) | 2021.10.14 |
---|---|
Nested cross validation (2) | 2021.10.01 |