📕가설의 종류
- 대립 가설(Alternative hypothesis)
- 표본에서 얻은 경험적 사실을 이용하여 연구자 주장의 타당성을 입증하고자 하는 통 계절 가설로 보통 H1로 표기한다.
- 귀무가설(Null hypothesis)
- 연구자의 주장에 충분한 증거가 없어 무효화(nullify)하려고 하는 가설로 보통 H0로 표기한다.
**📕오류의 종류**
- 표본을 가지고 모집단을 판단하게 되므로 항상 오류가 발생한다.
귀무가설(H0)이 True | 대립가설(H1)이 True | |
---|---|---|
H0기각,H1채택 | 제1종 오류 | 옳은 결정 |
H0채택,H1기각 | 옳은 결정 | 제 2종 오류 |
📕유의수준(significance level)
- 제1종 오류를 범할 확률의 허용 한계
- 유의 수준은 0.01, 0.05, 0.1등을 사용
👀가설 검정의 예시
📗H0(귀무가설) : 두 약의 효과의 차이가 있다고 할 수없다.
📗H1(대립가설) : 두 약의 효과의 차이가 있다.
📗제1종의 오류 : 귀무가설을 잘못 기각하는 오류
📗제2종의 오류 : 틀린 귀무가설을 채택하는 오류
📗유의수준
1종 오류의 최대 허용한계로 수준을 얼마로 잡아야 하는 문제는 통계적인 문제가 아니라 연구자가 결정사항.
ex) 예를 들어 유의 수준=0.05로 하는 것은 동일한 검정을 독립적으로 100번 정도 하였을 때 귀무가설을 잘못 기각하는 오류를 최대한 5번 정도 허용한다는 것을 의미한다.
📗검정 통계량(Test Statistic) 계산
표본자료로부터 산출되는 어떤 통계량을 말한다.
검정 통계량의 크기에 따라 검정 통계량이 따르는 분포에서 p값을 계산하여 귀무가설을 기각하느냐 기각하지 못하느냐를 결정하게 된다.
📗P-값(P-value)
- P값이 유의 수준보다 작다면 검정 통계량 값이 기각역에 들어간다는 것을 의미
- 귀무가설을 기각
- P값이 유의수준보다 크다면 검정통계량 값이 기각역에 들어가지 않는 것을 의미
- 귀무가설을 채택
📕가설검정의 7단계📕
자료(Data)
: 검정의 대상이 되는 자료의 특성을 잘 이해하여야 한다.가정(Assumptions) 체크
: ex) 모집단 분포의 정규성, 분산의 동일성, 표본의 독립성가설(Hypotheses) 설정
: 귀무가설과 대립 가설을 설정한다.유의 수준 설정
검정 통계량(Test Statistic) 계산
: 주어진 상황에 부합하는 제안된 검정 통계량을 계산통계적 결정(Statistical Decison)
: 귀무가설을 채택할지, 기각할지를 P-value를 통해 결정함.- P-value가 유의 수준보다 작다면 귀무가설을 기각
- P-value가 유의수준 보다 크다면 귀무가설을 채택
결론
: 통계적 결정에 따라 연구가설의 결론을 내린다.
💡R에서 제공되는 t-test를 이용
x=고양이의 몸무게
x=c(8.3,9.5,9.6,8.75,8.4,9.1,8.15,8.8)
t.test(x,mu=8.5)
✔해석
- 추정 : 고양이의 몸무게에 대판 표본 평균은 8.825kg이며, 고양이의 몸무게에 대한 95% 신뢰구간은 (8.37,9.27)이다.
- 가설 검정
- 가설
- H0(귀무가설) : 고양이의 몸무게 평균은 8.5이다.
- H1(대립 가설) : 고양이의 몸무게 평균은 8.5가 아니다.
- 유의 수준 = 0.05
- 검정 통계량 값(T) = 1.6986
- P값 = 0.1332 > 유의 수준
- H0을 기각할 수 없다.
- 결론 : 유의 수준 5%에서 고양이의 평균 몸무게는 8.5kg와 다르다고 할 수없다.
- 가설
💡사용자 함수 정의(R프로그래밍을 이용)
x=c(8.3,9.5,9.6,8.75,8.4,9.1,8.15,8.8)
mu0=8.5
T_test_1= function(x,mu0){
n=length(x); xbar=mean(x); se=sd(x)/sqrt(n)
lb=xbar-qt(0.975,n-1)*se
yb=xbar+qt(0.975,n-1)*se
T=(xbar-mu0)/se
pvalue=2*(1-pt(abs(T),n-1))
cat(" ============= 일표본 평균 검정 ================","\n","\n")
cat(" 표본평균 =",xbar,"95%신뢰 구간(",lb,yb,")","\n")
cat("T= ",T,"P-value=",pvalue,"\n")
}
T_test_1(x,mu=mu0)
t.test 결과와 동일한 결과를 얻을 수 있다.
'학교 > R프로그래밍' 카테고리의 다른 글
R프로그래밍 기말고사정리 09- 이표본 검정 (0) | 2022.06.13 |
---|---|
R프로그래밍 기말고사 정리 08 - 이표본비율 (0) | 2022.06.13 |
R프로그래밍 기말고사정리06- 일표본 유의성 검정 (0) | 2022.06.05 |
R프로그래밍 기말고사 정리 05- 데이터의 종류와 분석 (0) | 2022.06.05 |
R프로그래밍 기말고사 정리 04 - 연속확률분포에서의 중심극한정리 (0) | 2022.06.05 |