📕문제 설명 📗문제 설명 신입사원 무지는 게시판 불량 이용자를 신고하고 처리 결과를 메일로 발송하는 시스템을 개발하려 합니다. 무지가 개발하려는 시스템은 다음과 같습니다. 각 유저는 한 번에 한 명의 유저를 신고할 수 있습니다. 신고 횟수에 제한은 없습니다. 서로 다른 유저를 계속해서 신고할 수 있습니다. 한 유저를 여러 번 신고할 수도 있지만, 동일한 유저에 대한 신고 횟수는 1회로 처리됩니다. k번 이상 신고된 유저는 게시판 이용이 정지되며, 해당 유저를 신고한 모든 유저에게 정지 사실을 메일로 발송합니다. 유저가 신고한 모든 내용을 취합하여 마지막에 한꺼번에 게시판 이용 정지를 시키면서 정지 메일을 발송합니다. 다음은 전체 유저 목록이 ["muzi", "frodo", "apeach", "neo"]이..
전체 글
안녕하세요 💻탐욕알고리즘은 선택할 당시의 최적의 값을 구한다. 하지만 그 최적의 선택이 전체적으로 볼때 최적의 선택일지는 보장이 안됨. 진약수는 1과 자기자신을 제외한다. 여기서 최소값과 최대값을 찾아서 곱하면 N이 나올것이다. 따라서 N을 구할때의 최소비교횟수는 진약수의 개수를 최대 최소 동시에 찾기 공식에 넣으면 됨. 최대값 찾기 : n-1 차대값 찾기 : n+lgn-2 중앙값 찾기 : 5/6 * n 최대최소 동시에 찾기 : 홀수일때[ 3n/2- 3/2] 짝수일떄[3n/2-2] 차대키의 후보들의 집합은 : 최대키한테 진 집합들이다. 적대적 논증 : 최악시간복잡도가의 lower bound를 구함. 몬테 카를로 알고리즘 : 반드시 맞는 답을 주지는 않음. 오히려 그 답의 추정치를 제공하고 그 추정치가 맞는 답에 가까..
개념 비교 이항 분포만 가능 모비율에 대한 신뢰구간의 신뢰도 비교 시물레이션 입력값 : 모비율(p), 표본의 크기(n), 자료 set의 크기(m), 신뢰도(alpha) 입력 p=0.5;n=5;m=100000;alpha=0.95 코드 n=c(5,10,25,50) p=0.5;m=100000;alpha=0.95 a=alpha+(1-alpha)/2 qn=qnorm(a) count=0 for(i in 1: length(n)){ for(j in 1: m){ x=rbinom(n[i],1,p) phat=sum(x)/n[i] se=sqrt(phat*(1-phat))/sqrt(n[i]) L=phat-qn*se U=phat+qn*se if(p>=L && p
💡모평균의 신뢰구간 신뢰구간이 u를 포함학 확률이 (1-α)*100 % dp 가까운지 확인 📕정규분포 모집단이 정규분포인 경우 모평균에 대한 신뢰구간의 신뢰도 비교 시뮬레이션 입력값 : 모평균(mu), 모표준편차(sd), 표본의 크기(n), 자료 set의 크기(m), 신뢰도(alpha) 📗입력 mu=0; sd=1;n=5;m=100000;alpha=0.95 📗크기 mu=0; sd=1;m=100000;alpha=0.95 n=c(5,10,15,20) count=0 a=alpha+(1-alpha)/2 for(j in 1 : length(n)){ for(i in 1 : m){ x=rnorm(n[j],mu,sd) xbar=mean(x) se=sd(x)/sqrt(n[j]) L=xbar-qt(a,n[j]-1)*se U..
모 비율차 검정 A그룹에서의 비율과 B그룹에서의 비율이 같은지 검정 📜예제자료 x=c(100,170) n=c(300,400) (x [1], n [1]) = 300번 중에 100번 성공했다 라는 뜻 (x [2], n [2]) = 400번 중에 170번 성공했다 라는 뜻. 📗모 비율차 검정 prop.test(x,n) 💡해석 추정 : D후보의 A도시에서의 지지율은 33%, B도시에서의 지지율은 42.5$% 이다. 가설 검정 가설 H0 : A도시와 B도시에서의 지지율은 같다. [귀무가설] H1: A도시와 B도시에서의 지지율은 다르다. [대립 가설] 유의 수준 α= 0.05 검정 통계량 =5.6988 P-value = 0.01698 귀무가설을 기각, 대립 가설을 채택 결론 : 유의 수준 5%에서 A도..
📃종속 표본(Paired T-test) : 짝을 이룬 자료 치료 전후의 혈압변화, 교육 전후의 점수 변화, 다이어트 전후의 체중변화 등 같은 사람에게 반복하여 측정하는 경우, 처치 전의 측정치가 처치 후의 측정치와 차이가 있는 지를 검정 대표적인 통계기법 모수적 기법 - Paired T-test 비모수적 기법 - Sign test, Wilcoxon signed rank test 자료 형태 📕중간,기말 점수에 대한 이 표본 검정 📗R에 제공된 기능 before=c(77,56,64,60,58,72,67,78,67,79) after=c(99,80,78,65,59,67,65,85,74,80) t.test(after,before,paired=T) 💡해석 가설검정 H0 : 중간점수와 기말 점수는 같다. [귀무가설]..
이변량 데이터 : 변수가 두 개인 것 ex) 성별에 따른 키 다음 자료는 성별에 따른 키 이다. 남자가 1이고 여자가 2이다. 이러한 자료들은 이표본 검정할 것이다. 아래 자료는 방법 1, 방법 2에 따른 질소성분 함량이다. (등분산이라고 가정) method=c(1,1,1,1,1,2,2,2,2) x=c(19.1,32.8,27.6,25.9,28.5,17.0,16.4,16.8,15.5) t.test(x~method,var.equal=T) 💡해석 추정 : 방법 1의 평균 질소성분 함유량은 26.78, 방법2의 평균 질소성분함유량은 16.46이며, 방법1과 방법2의 평균 질소성분함유량에 대한 95%신뢰구간은 (4.33,16.37)이다. 가설 검정 가설 H0 : 방법 1과 방법 2의 평균 질소 성분함유량은 같다...
📗독립인 자료(Independent data) 비교하고자 하는 두 집단의 측정치들이 서로 다른 개체에서 얻어진 것으로 한 집단의 측정치가 다른 집단의 측정치에 영향을 주지 않는 경우에 얻어진 자료로 각 개체들은 서로 독립이어야 한다. 💡대표적인 통계 기법 모수적 기법 : T-test 비모수적 기법 : Wilcoxon rank sum test(Mann-Whitney U test), Median test 💡독립 이 표본 t-test 명칭 그대로 두 개의 독립적인 모집단에서 추출된 표본을 이용하여 두 집단의 모평균을 비교하는 검정입니다. 대응 이표본 t-test는 한 그룹에게 A 약 투여 후 효과에 대한 전후 비교, 독립 이표본 t-test는 A 약고 B약에 대해 두 그룹을 나누어 효과 비교 독립 이표본 t-..
💡이 표본비율 prop.test(x, n, p) 표본으로부터 모집단의 비율을 추정 및 검정할 때 사용. ex) 찬성과 반대중 어느 비율이 높은지 추정 정규 분포 근사를 사용한다. 콘서트를 하는데 100명 중에 42명이 참석을 했다면 참석률은 50%라고 할 수 있을까? 에 대한 검정이다. 📕R에서 제공 prop.test(42,100,0.5) //prop.test(n,x,p) 💡해석 1. 추정 콘서트의 참석률의 표본 참석률은 42%이며, 콘서트의 참석률의 95% 신뢰구간은 (32%, 52%)이다. 2. 가설검정 가설 H0 : 콘서트 참석률은 50%이다. H1 : 콘서트 참석률은 50%와 다르다. 유의 수준 α=0.05 검정 통계량 = 2.25 P-value = 0.1336 > α ==> H0(귀무가설) 채택..