🙏이항 분포 par(mfrow=c(2,2)) n=c(10,100,1000,100000) length(n) for(j in 1: length(n)) { n1=30;p=0.1;mu=n1*p;var=n1*p*(1-p) ##모평균은 3, 모분산은 2.7 m=1000 xbar=rep(0,m) for( i in 1 : m){ x=rbinom(n[j],n1,p) xbar[i]=mean(x)} xbar_mu = mean(xbar) xbar_var= var(xbar);xbar_var cat("모평균 = ",mu,"표본분포의 평균 = ",xbar_mu,"\n","모분산 = ",var,",var/n = ",var/n[j],"표본평균의 분산 = ",xbar_var,"\n") hist(xbar,breaks="fd",prob=T..
학교/R프로그래밍
통계 이론은 이미 알고 있는 약간의 정보를 이용하여 미지의 상황을 파악하는데 도움을 주는 과학적인 방법이다. 미지의 상황이란 항상 확정적 사건이라기보다는 어떤 사건이 더 발생할 가능성이 많은가로 평가되어야 함은 당연하다. 그래서 확률의 개념은 매우 빈번하게 사용되고 있다. 그러나 정확한 확률을 계산한다는 것은 매우 지루하고 힘든 과정을 요한다. 그래서 어떤 사건이 일어날 수 있는 가능성을 표로 요약한 것을 확률분포라고 한다. 이러한 확률분포를 만들기 위해서는 각 사건이 일어날 가능성을 찾아야 하는데, 때론 이 과정이 매우 어렵다. 다행히 어떤 사건이 규칙성이 있어 수학적 함수로 표현 가능하다면 확률의 계산은 매우 편리할 것이며, 더욱이 이 수학적 함수가 우리 실생활에서 흔히 일어날 수 있는 사건과 유사하..
●정규성 검정 데이터셋의 분포가 정규분포를 따르는지를 검정하는 것이다. ▷정규성 검정을 하는 방법 Q-Q plot Q-Q plot는 정규분포 분 위수 대조 도라 고한다. 정규 모집단 가정을 하는 방법 줌 하나이며, 수집 데이터를 표준 정규분포의 분 위수와 비교하여 그리는 그래프이다. ○정규 확률 그림 par(mfrow=c(1,2)); n=10 x=rnorm(n,0,1) hist(x,prob=T,main="Normal(0,1)",col=2) curve(dnorm(x),add=T,col=4) ## qqnorm(x,sub="Normal") ## Q-Q plot qqline(x) ##y=x 그래프 추가 --> 난수의 개수가 적어서 히스토그램 그래프와 q-q plot에서 모양이 틀어짐을 알 수 있다. ★난수의 개..
★연속확률분포는 난수 그래프를 hist(rx)로 그림. 이산형분포는 plot으로 table(rx)을 넘겨줘서 그림 1. 정규 분포 ○N(0,1)에서 난수 발생 그래프 rnorm(10,mean=0,sd=1) ##N(0,1)에서 10개의 난수 발생 rx=rnorm(10,0,1) hist(rx,probability=T,main="난수 10개인 그래프") curve(dnorm(x,0,1),add=T) n값이 작으니 그래프 모양이 이상하다. 앞에서 한 것처럼 n을 키워보자. rnorm(10,mean=0,sd=1) ##N(0,1)에서 10개의 난수 발생 par(mfrow=c(2,2)) rx=rnorm(10,0,1) hist(rx,probability=T,main="난수 10개인 그래프",ylim=c(0,0.6)) ..
1.베르누이 시행 B(1,p) n이 1일때의 이항분포를 베르누이 시행이라고 한다. ○P(x)를 이용 plot을 사용 n=1; p=0.5; x=c(0:n) y=dbinom(x,1,p) plot(x,y,type="h",col="black",lwd=5,main="베르누이 시행B(1,p)") ○난수를 이용 r~:난수 발생 type="h" y=rbinom(10,1,0.3);y [1] 0 0 1 0 1 0 0 0 0 1 ##B(1,0.3)에서 무작위 난수 10개가 발생된다. n=1;p=0.5;x=c(0:n) ##rbinom(size,n,p) B(n,p)에서 size개만큼 난수를 발생 rbinom(100,n,p) ## x,y순서쌍이 아닌 x값만 존재 ##따라서 y값에 rbinom()값을 저장시킴. y=rbinom(1..
1.t 분포란? t 분포는 모집단 표준편차를 알 수 없을 때 표본 평균과 모집단 평균 사이 표준화된 거리를 설명하며, 관측값은 정규 분포를 따르는 모집단에서 추출된다. ## dt(x,df) dt(0,df=5) pt(0,df=5) pt(1.96,df=5) pt(2.58,df=5) pt(2,5)-pt(1,5) # P(1
저번에는 이산형 분포에서의 확률 계산과 그래프를 그려봤다. 이번에는 연속확률분포에서의 확률 계산과 그래프 그리는 것에 대해 알아볼것이다. 1.정규분포 ##dnorm(x,mean,sd) N(mean,sd) = f(x=0) pnorm(-1.96,0,1,lower.tail=T) ##lower.tail=T면 p(x=-1.96) ##lower.tail의 default값은 T이다. pnorm(1.96,0,1) ##p(x
이항 분포 d~: 확률질량함수 , p~ : 누적 분포함수 이항분포 ○확률 질량 함수 dbinom(x,size,p)## x좌표 n크기 확률 dbinom(0,10,0.3)##P(x=0) pbinom(5,10,0.3) ##P(x
1.연속형 일양 분포( X~ U(0,n)) x값과 상관없이 확률이 일정하다. n=10 curve(x/x/n,0,n,col=2,lwd=3) m=0;s2=1 #m=평균 s2=분산 curve( (1/sqrt(2*pi*s2))*exp(-1*(x-m)^2/(2*s2)),-5,5,col=2,lwd=5,main="N(0,1)인 정규분포 그래프") 만약 평균은 같고 분산값만 달라진다면 그래프의 모양은 어떻게 변할까? ▶겹쳐서 그리기 curve (add=T) 활용 m=0;s2=1;s3=2;s4=3;s5=4 curve( (1/sqrt(2*pi*s2))*exp(-1*(x-m)^2/(2*s2^2)),-5,5,col=2,lwd=5,main="N(0,1)인 정규분포 그래프") curve( (1/sqrt(2*pi*s3))*exp(..