공부

가설검정

무른2 2024. 11. 30. 17:16

*데이터드리븐리포트(이상석,2023)을 참고하여 작성하였습니다.

 

대립가설(H1)

  • 증명하고자 하는 가설

 

귀무가설(H0)

  • 대립가설이 증명되지 않았을 때 원래 상태로 돌아가는 가설

 

유의 수준(p-value)

  • 가설을 증명하는 데 필요한 증거의 수준
  • 일반적으로 0.05로 설정되며 0.05미만이면 귀무가설을 거부하고 대립가설을 뒷받침하는 증거가 있다고 결론을 내릴 수 있다.

 

가설검정 방법

 

1. 일표본 t-검정(one sample t-test)

  • 표본 평균을 알려진 모집단 평균과 비교하는 데 사용하는 통계검정 방법으로 하나의 변수에 대한 측정값을 알려준다.
  • 표본 평균과 모집단 평균 사이에 유의미한 차이가 있는지 판단하는 데 사용

2. 이표본 t-검정(two sample t-test)

  • 독립된 두 변수에 대한 연속형 값의 평균차를 측정할 때 사용

3. 대응표본 t-검정(paried sample t-test)

  • 두 개의 관련된 변수에 대한 측정값을 알려준다.

4. 카이제곱검정(chi-squared test)

  • 두 개 이상의 범주형 변수에 대한 도수 분포
  • 두 변수가 모두 범주형인 상황에서는 두 변수의 범주들이 교차하는 칸마다 각 변수의 범주를 동시에 갖는 관측값의 수를 분할표로 만든다.

5. 분산분석검정(ANOVA)

  • 하나의 연속형 변수와 하나 이상의 범주형 변수에 대한 측정값을 알려준다.
  • f-value : 차이/ 불확실도(t-value와 같은 의미)
  • 세 표본 그룹의 평균값 차이를 계산시 동시에 표본 그룹의 평균값들은 오차를 수반한다는 것을 염두해야 한다.

6. 회귀분석

  • 두 개 이상의 연속형 변수에 대한 측정값을 알려준다.
  • 선형회귀분석은 데이터 타입이 연속형 숫자이며 종속변수와 독립변수로 명확하게 구분시 적용 가능.

 

상황별 가설검정 방법 

 

분석 목표(가설검정 주제) 모수적 방법(정규성) 비모수적 방법(정규성X)
독립된 두 집단의 평균 비교 t-검정 윌콕슨 검정
짝지은 두 집단의 평균 비교 대응표본 t-검정 윌콕슨 부호 순위 검정
세 집단 이상의 평균 비교 분산분석검정 크루스칼 왈리스 검정
두 변수 간 상관관계 피어슨 상관계수 스피어만 상관계수, 켄달타우 계수
독립변수와 연속형 종속 변수와 관계 회귀분석
독립변수와 이진 종속 변수와의 관계 로지스틱 회귀분석
두 집단 이상의 빈도 비교 카이제곱검정 피셔 정확 검정
시간에 따른 이벤트 발생 위험도 산출 life table, 카플란 마이어 분석