Table of Contents
1.귀무가설과 대립가설
귀무가설과 대립가설은 통계적 가설 검정(statistical hypothesis testing)에서 사용되는 두 주요 개념입니다. 이들은 연구자가 수집한 데이터를 기반으로 통계적 결정을 내리는 데 사용됩니다.
귀무가설 (Null Hypothesis, 𝐻0)
귀무가설은 보통 '변화가 없다', '효과가 없다', 또는 '차이가 없다'는 가설입니다. 다시 말해, 두 집단 간의 차이가 없거나, 어떤 처리가 효과가 없다는 것을 기본적으로 가정합니다. 귀무가설은 기존의 지식이나 이론을 바탕으로 설정되며, 이 가설을 검증하기 위해 데이터를 수집하고 분석합니다.
- 예시: 새로운 교육 프로그램이 학생들의 성적에 영향을 미치지 않는다. (𝐻0:𝜇𝑛𝑒𝑤=𝜇𝑜𝑙𝑑)
대립가설 (Alternative Hypothesis, 𝐻𝑎 또는 𝐻1)
대립가설은 귀무가설과 반대되는 가설로, 연구자가 실제로 입증하고자 하는 가설입니다. 이는 보통 귀무가설이 틀렸다는 것을 증명함으로써, 어떤 효과가 있다거나 차이가 있다는 것을 주장합니다.
- 예시: 새로운 교육 프로그램이 학생들의 성적을 향상시킨다. (𝐻𝑎:𝜇𝑛𝑒𝑤>𝜇𝑜𝑙𝑑)
가설 검정 과정
가설 검정은 다음과 같은 단계를 따릅니다:
- 귀무가설과 대립가설 설정: 연구의 목적에 따라 두 가설을 명확하게 정의합니다.
- 적절한 검정 통계량 선택: 데이터의 유형과 가설에 따라 t-test, ANOVA, 카이제곱 검정 등 적절한 통계적 검정 방법을 선택합니다.
- 유의 수준 설정: 통계적 결정을 내리기 위한 기준인 유의 수준(𝛼)을 설정합니다. 일반적으로 0.05(5%)를 사용합니다.
- 데이터 수집 및 검정 통계량 계산: 실험 또는 관찰을 통해 데이터를 수집하고, 선택한 통계 방법을 사용하여 검정 통계량을 계산합니다.
- 결론 도출: 계산된 검정 통계량과 임계값을 비교하여 귀무가설을 기각할지 여부를 결정합니다. 만약 검정 통계량이 임계값보다 크면 귀무가설을 기각하고 대립가설을 채택합니다.
이러한 과정을 통해 연구자는 데이터에 근거하여 합리적인 결정을 내릴 수 있으며, 연구 질문에 대한 답을 얻을 수 있습니다.
2. 1종 오류와 2종 오류
통계적 가설 검정에서는 두 가지 유형의 오류가 발생할 수 있습니다: 1종 오류(Type I error)와 2종 오류(Type II error). 이러한 오류들은 검정 과정에서 잘못된 결론을 내리는 상황을 설명합니다.
1종 오류 (Type I Error)
1종 오류는 귀무가설이 사실일 때, 귀무가설을 잘못 기각하는 오류입니다. 다시 말해, 실제로는 차이가 없거나 효과가 없는데, 차이가 있다거나 효과가 있다고 잘못 결론 내리는 경우입니다. 이를 '거짓 양성(false positive)'이라고도 합니다.
- 예시: 실제로는 효과가 없는 약을 효과가 있다고 잘못 판단하는 경우.
- 통계적 의미: 1종 오류의 확률은 유의 수준 𝛼로 설정됩니다. 일반적으로 0.05(5%)로 설정하는데, 이는 100번의 검정 중 5번은 귀무가설이 참임에도 불구하고 잘못 기각할 수 있음을 의미합니다.
2종 오류 (Type II Error)
2종 오류는 대립가설이 사실일 때, 귀무가설을 잘못 채택하는 오류입니다. 즉, 실제로는 차이가 있거나 효과가 있는데, 차이가 없거나 효과가 없다고 잘못 결론 내리는 경우입니다. 이를 '거짓 음성(false negative)'이라고도 합니다.
- 예시: 실제로 효과가 있는 약을 효과가 없다고 잘못 판단하는 경우.
- 통계적 의미: 2종 오류의 확률은 𝛽로 표시되며, 이와 관련된 개념으로 '검정력(power)'이 있습니다. 검정력은 1-𝛽로 계산되며, 이는 대립가설이 참일 때 올바르게 대립가설을 채택할 확률을 의미합니다.
균형 잡기
1종 오류와 2종 오류 사이에는 일종의 트레이드오프(trade-off) 관계가 있습니다. 유의 수준 𝛼를 낮추면 1종 오류의 확률은 줄어들지만, 동시에 2종 오류의 위험이 증가할 수 있습니다. 반대로 𝛼를 높이면 1종 오류의 확률이 증가하고 2종 오류의 확률은 감소합니다. 따라서 실험의 목적과 중요성에 따라 적절한 균형을 찾아 유의 수준과 검정력을 설정해야 합니다.
3. 유의확률
유의확률(p-value)은 통계적 가설 검정에서 사용되는 매우 중요한 개념입니다. 이 값은 연구자가 설정한 귀무가설이 얼마나 타당한지를 수치적으로 나타내는 지표로, 귀무가설 하에서 관측된 결과 또는 더 극단적인 결과가 나타날 확률을 의미합니다.
유의확률의 정의
- 유의확률(p-value): 통계적 검정에서 사용되는 측정 지표로, 귀무가설이 참이라고 가정했을 때, 실제 관측된 통계값 또는 더 극단적인 통계값이 관측될 확률입니다.
유의확률의 해석
- 낮은 p-value (<0.05 일반적으로): 귀무가설이 참일 확률이 낮다는 것을 나타냅니다. 즉, 관측된 데이터가 귀무가설을 지지하지 않는다는 강력한 증거가 됩니다. 이 경우, 일반적으로 귀무가설을 기각하고, 연구 가설(대립가설)을 지지합니다.
- 높은 p-value (≥0.05 일반적으로): 귀무가설이 참일 가능성이 높다는 것을 나타냅니다. 즉, 관측된 데이터가 귀무가설과 모순되지 않으므로 귀무가설을 기각할 충분한 근거가 없습니다.
유의확률의 사용
유의확률은 데이터가 얼마나 귀무가설을 지지하는지를 나타내는 지표이지만, 직접적으로 '귀무가설이 참이다' 또는 '거짓이다'를 증명하는 것은 아닙니다. 대신, 유의확률은 데이터가 귀무가설 하에서 얼마나 이례적인지를 평가하는 데 도움을 줍니다.
유의확률과 의사결정
유의확률은 통계적 의사결정 과정에서 중요한 역할을 합니다. 연구자는 사전에 유의 수준(α)을 설정하고, 유의확률(p-value)을 이 유의 수준과 비교하여 귀무가설의 기각 여부를 결정합니다. 예를 들어, 유의 수준을 0.05로 설정하고 유의확률이 0.03이 나왔다면, 이는 유의 수준보다 작으므로 귀무가설을 기각하고 효과가 있다고 결론 지을 수 있습니다.
주의점
유의확률이 실험의 질이나 결과의 중요성을 나타내는 것은 아니며, 오직 주어진 귀무가설이 주어진 데이터 세트와 얼마나 부합하는지를 나타내는 지표입니다. 따라서 유의확률 해석 시 다른 맥락적 요소들과 함께 고려되어야 합니다.
유의 수준 𝛼를 0.05나 0.01과 같은 값으로 설정하는 것은 오랜 통계적 전통과 실용적인 고려에 기반합니다. 이러한 값들은 연구자가 귀무가설을 잘못 기각할 위험을 얼마나 감수할 용의가 있는지를 수치로 표현합니다. 즉, 연구자가 1종 오류(귀무가설이 참인데 잘못 기각하는 경우)를 범할 최대 허용 확률을 의미합니다.
역사적 배경
0.05라는 유의 수준은 1920년대 통계학자 로널드 피셔에 의해 처음 제안되었습니다. 피셔는 실험적 연구에서 초기에 사용할 '표준 오류'로 0.05를 제시했습니다. 이는 100번의 실험 중 약 5번 귀무가설을 잘못 기각할 수 있다는 것을 의미하며, 이것이 통계적으로 유의한 결과를 얻는 데 충분히 보수적인 접근이라고 여겨졌습니다. 이후 이 수치는 많은 과학적 연구에서 일종의 표준으로 받아들여졌습니다.
실용적인 고려
- 균형 잡기: 유의 수준은 1종 오류와 2종 오류 사이의 균형을 잡는 데 중요한 역할을 합니다. 0.05나 0.01 같은 값은 연구자가 이러한 오류 중 어느 하나에 치우치지 않게 하면서도 통계적으로 의미 있는 결과를 얻을 수 있는 균형점을 제공합니다.
- 컨벤션: 과학 분야에서는 이러한 유의 수준이 널리 통용되어 왔습니다. 따라서 연구 결과의 해석과 비교가 다른 연구와 일관되게 이루어질 수 있습니다.
- 객관성: 유의 수준을 사전에 설정함으로써 연구 결과에 대한 객관적인 기준을 마련할 수 있습니다. 이는 연구의 신뢰성을 높이는 데 도움이 됩니다.
선택의 유연성
물론 모든 연구에서 유의 수준을 0.05나 0.01로 설정해야 하는 것은 아닙니다. 연구의 맥락, 목적, 위험도, 연구 대상의 중요성 등을 고려하여 더 보수적인 유의 수준(예: 0.001)을 선택하거나 더 유연한 유의 수준(예: 0.10)을 사용할 수도 있습니다. 중요한 것은 선택한 유의 수준이 연구 질문과 목적에 적합하며, 그 근거가 명확해야 한다는 점입니다.
이렇게 유의 수준을 설정하는 것은 연구 설계의 중요한 부분이며, 그 선택은 연구의 맥락과 연구자의 판단에 따라 달라질 수 있습니다.
'통계' 카테고리의 다른 글
t-test t검정/ ANOVA 분산분석 (0) | 2024.04.25 |
---|---|
종속표본 t-test t검정 (0) | 2024.04.25 |
독립표본 / 종속표본 / t-test t검정/ t-stat t통계량/ p-value유의확률/ two-tailed test양측검정 (0) | 2024.04.25 |
[학습블로그] p-value 귀무가설 대립가설 5살 유치원생도 이해할 수 있게 설명해줄게요 (0) | 2024.04.24 |
산술평균 기하평균 조화평균 (0) | 2024.04.24 |
- Total
- Today
- Yesterday
- Github
- recursion #재귀 #자료구조 # 알고리즘
- RAG
- 손실함수
- Python
- LLM
- #패스트캠퍼스 #UpstageAILab #Upstage #부트캠프 #AI #데이터분석 #데이터사이언스 #무료교육 #국비지원 #국비지원취업 #데이터분석취업 등
- 해시
- PEFT
- 파이썬
- Transformer
- t5
- cnn
- Array
- clustering
- 오블완
- nlp
- 코딩테스트
- speaking
- classification
- 티스토리챌린지
- 리스트
- LIST
- git
- Lora
- Numpy
- Hugging Face
- #패스트캠퍼스 #패스트캠퍼스ai부트캠프 #업스테이지패스트캠퍼스 #upstageailab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- English
- #패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |