*데이터드리븐리포트(이상석,2023)을 참고하여 작성하였습니다.
대립가설(H1)
- 증명하고자 하는 가설
귀무가설(H0)
- 대립가설이 증명되지 않았을 때 원래 상태로 돌아가는 가설
유의 수준(p-value)
- 가설을 증명하는 데 필요한 증거의 수준
- 일반적으로 0.05로 설정되며 0.05미만이면 귀무가설을 거부하고 대립가설을 뒷받침하는 증거가 있다고 결론을 내릴 수 있다.
가설검정 방법
1. 일표본 t-검정(one sample t-test)
- 표본 평균을 알려진 모집단 평균과 비교하는 데 사용하는 통계검정 방법으로 하나의 변수에 대한 측정값을 알려준다.
- 표본 평균과 모집단 평균 사이에 유의미한 차이가 있는지 판단하는 데 사용
2. 이표본 t-검정(two sample t-test)
- 독립된 두 변수에 대한 연속형 값의 평균차를 측정할 때 사용
3. 대응표본 t-검정(paried sample t-test)
- 두 개의 관련된 변수에 대한 측정값을 알려준다.
4. 카이제곱검정(chi-squared test)
- 두 개 이상의 범주형 변수에 대한 도수 분포
- 두 변수가 모두 범주형인 상황에서는 두 변수의 범주들이 교차하는 칸마다 각 변수의 범주를 동시에 갖는 관측값의 수를 분할표로 만든다.
5. 분산분석검정(ANOVA)
- 하나의 연속형 변수와 하나 이상의 범주형 변수에 대한 측정값을 알려준다.
- f-value : 차이/ 불확실도(t-value와 같은 의미)
- 세 표본 그룹의 평균값 차이를 계산시 동시에 표본 그룹의 평균값들은 오차를 수반한다는 것을 염두해야 한다.
6. 회귀분석
- 두 개 이상의 연속형 변수에 대한 측정값을 알려준다.
- 선형회귀분석은 데이터 타입이 연속형 숫자이며 종속변수와 독립변수로 명확하게 구분시 적용 가능.
상황별 가설검정 방법
분석 목표(가설검정 주제) | 모수적 방법(정규성) | 비모수적 방법(정규성X) |
독립된 두 집단의 평균 비교 | t-검정 | 윌콕슨 검정 |
짝지은 두 집단의 평균 비교 | 대응표본 t-검정 | 윌콕슨 부호 순위 검정 |
세 집단 이상의 평균 비교 | 분산분석검정 | 크루스칼 왈리스 검정 |
두 변수 간 상관관계 | 피어슨 상관계수 | 스피어만 상관계수, 켄달타우 계수 |
독립변수와 연속형 종속 변수와 관계 | 회귀분석 | |
독립변수와 이진 종속 변수와의 관계 | 로지스틱 회귀분석 | |
두 집단 이상의 빈도 비교 | 카이제곱검정 | 피셔 정확 검정 |
시간에 따른 이벤트 발생 위험도 산출 | life table, 카플란 마이어 분석 |
'공부' 카테고리의 다른 글
[혼공컴운] 1주차_컴퓨터 구조/데이터/명령어 (0) | 2025.01.12 |
---|---|
xgboost 모델 (0) | 2024.12.26 |
[데벨챌 4기] 그로스 해킹 (그로스 해킹 시작부터, 성장 실험까지/ 그로스 조직과 업무 프로세스) (2) | 2024.11.23 |
[데벨챌 4기] 그로스 해킹 (지표) (0) | 2024.11.16 |
[데밸첼 4기] 그로스 해킹 (그로스해킹이란?/전제조건/AARRR) (1) | 2024.11.09 |