모 비율차 검정 A그룹에서의 비율과 B그룹에서의 비율이 같은지 검정 📜예제자료 x=c(100,170) n=c(300,400) (x [1], n [1]) = 300번 중에 100번 성공했다 라는 뜻 (x [2], n [2]) = 400번 중에 170번 성공했다 라는 뜻. 📗모 비율차 검정 prop.test(x,n) 💡해석 추정 : D후보의 A도시에서의 지지율은 33%, B도시에서의 지지율은 42.5$% 이다. 가설 검정 가설 H0 : A도시와 B도시에서의 지지율은 같다. [귀무가설] H1: A도시와 B도시에서의 지지율은 다르다. [대립 가설] 유의 수준 α= 0.05 검정 통계량 =5.6988 P-value = 0.01698 귀무가설을 기각, 대립 가설을 채택 결론 : 유의 수준 5%에서 A도..
📃종속 표본(Paired T-test) : 짝을 이룬 자료 치료 전후의 혈압변화, 교육 전후의 점수 변화, 다이어트 전후의 체중변화 등 같은 사람에게 반복하여 측정하는 경우, 처치 전의 측정치가 처치 후의 측정치와 차이가 있는 지를 검정 대표적인 통계기법 모수적 기법 - Paired T-test 비모수적 기법 - Sign test, Wilcoxon signed rank test 자료 형태 📕중간,기말 점수에 대한 이 표본 검정 📗R에 제공된 기능 before=c(77,56,64,60,58,72,67,78,67,79) after=c(99,80,78,65,59,67,65,85,74,80) t.test(after,before,paired=T) 💡해석 가설검정 H0 : 중간점수와 기말 점수는 같다. [귀무가설]..
이변량 데이터 : 변수가 두 개인 것 ex) 성별에 따른 키 다음 자료는 성별에 따른 키 이다. 남자가 1이고 여자가 2이다. 이러한 자료들은 이표본 검정할 것이다. 아래 자료는 방법 1, 방법 2에 따른 질소성분 함량이다. (등분산이라고 가정) method=c(1,1,1,1,1,2,2,2,2) x=c(19.1,32.8,27.6,25.9,28.5,17.0,16.4,16.8,15.5) t.test(x~method,var.equal=T) 💡해석 추정 : 방법 1의 평균 질소성분 함유량은 26.78, 방법2의 평균 질소성분함유량은 16.46이며, 방법1과 방법2의 평균 질소성분함유량에 대한 95%신뢰구간은 (4.33,16.37)이다. 가설 검정 가설 H0 : 방법 1과 방법 2의 평균 질소 성분함유량은 같다...
📗독립인 자료(Independent data) 비교하고자 하는 두 집단의 측정치들이 서로 다른 개체에서 얻어진 것으로 한 집단의 측정치가 다른 집단의 측정치에 영향을 주지 않는 경우에 얻어진 자료로 각 개체들은 서로 독립이어야 한다. 💡대표적인 통계 기법 모수적 기법 : T-test 비모수적 기법 : Wilcoxon rank sum test(Mann-Whitney U test), Median test 💡독립 이 표본 t-test 명칭 그대로 두 개의 독립적인 모집단에서 추출된 표본을 이용하여 두 집단의 모평균을 비교하는 검정입니다. 대응 이표본 t-test는 한 그룹에게 A 약 투여 후 효과에 대한 전후 비교, 독립 이표본 t-test는 A 약고 B약에 대해 두 그룹을 나누어 효과 비교 독립 이표본 t-..
💡이 표본비율 prop.test(x, n, p) 표본으로부터 모집단의 비율을 추정 및 검정할 때 사용. ex) 찬성과 반대중 어느 비율이 높은지 추정 정규 분포 근사를 사용한다. 콘서트를 하는데 100명 중에 42명이 참석을 했다면 참석률은 50%라고 할 수 있을까? 에 대한 검정이다. 📕R에서 제공 prop.test(42,100,0.5) //prop.test(n,x,p) 💡해석 1. 추정 콘서트의 참석률의 표본 참석률은 42%이며, 콘서트의 참석률의 95% 신뢰구간은 (32%, 52%)이다. 2. 가설검정 가설 H0 : 콘서트 참석률은 50%이다. H1 : 콘서트 참석률은 50%와 다르다. 유의 수준 α=0.05 검정 통계량 = 2.25 P-value = 0.1336 > α ==> H0(귀무가설) 채택..
💡Intractability 사전적인 의미로는 취급하거나 작업하기 어렵다는 뜻이다. CS적인 관점에서는 문제가 Intractable하다는 뜻은 polynomial-time-algorithm(다차시간 알고리즘)으로 못푼다는 의미이다. polynomial-time algorithm은 최악 시간복잡도의 상한이 입력크기의 다항식 함수가 되는 알고리즘이다. 다루기 힘든 정도는 문제를 푸는 어떤 특정 알고리즘의 성질이 아니라 문제의 성질이라는 사실을 반드시 알아야한다. 다루기 힘든 정도에 대하여 3가지 종류로 문제를 분류할 수 있다. 1.다차시간 알고리즘을 찾은 문제 2.다루기 힘들다고 증명된 문제 3.다루기 힘들다고 증명되지도 않았지만, 다차시간 알고리즘도 찾지 못한 문제(NP-complete) 예를 들어 TSP..
📕문제 아래 그림과 같이 삼각형 모양으로 숫자를 쌓기로 했다. 위와 같이 경표는 끝도 없이 피라미드를 쌓을 때, N층의 제일 왼쪽, 오른쪽에 쓰게 될 숫자가 무엇일지 예측해보자. 📕입력 첫 번째 줄에 테스트 케이스의 수 T가 주어진다. 각 테스트 케이스의 첫 번째 줄에는 층의 번호 N(1≤N≤109)이 주어진다. 📕출력 각 테스트 케이스마다 ‘#x’(x는 테스트 케이스 번호를 의미하며 1부터 시작한다)를 출력하고, 각 테스트 케이스마다 N층의 제일 왼쪽, 오른쪽에 쓰게 될 숫자를 공백으로 구별하여 출력한다 📗입력 예시 3 1 2 3 // 테스트 케이스 개수 // 첫 번째 테스트 케이스, N = 1, K = 1 // 두 번째 테스트 케이스, N = 3, K = 7 // 세 번째 테스트 케이스, N = 9,..
📕문제 지원이는 대회에 출제할 문제에 대해서 고민하다가 소인수분해 문제를 출제해야겠다고 마음을 먹었다. 그러나 그 이야기를 들은 동생의 반응은 지원이의 기분을 상하게 했다. "소인수분해? 그거 너무 쉬운 거 아니야?" 지원이는 소인수분해의 어려움을 알려주고자 엄청난 자신감을 가진 동생에게 2와 500만 사이의 자연수 N개를 주고 소인수분해를 시켰다. 그러자 지원이의 동생은 기겁하며 쓰러졌다. 힘들어하는 지원이의 동생을 대신해서 여러분이 이것도 쉽다는 것을 보여주자! 📕입력 첫째 줄에는 자연수의 개수 N (1 ≤ N ≤ 1,000,000)이 주어진다. 둘째 줄에는 자연수 ki (2 ≤ ki ≤ 5,000,000, 1 ≤ i ≤ N)가 N개 주어진다. 📕출력 N 줄에 걸쳐서 자연수 ki의 소인수들을 오름차순..
문제 M이상 N이하의 소수를 모두 출력하는 프로그램을 작성하시오. 입력 첫째 줄에 자연수 M과 N이 빈칸을 사이에 두고 주어진다. (1 ≤ M ≤ N ≤ 1,000,000) M이상 N이하의 소수가 하나 이상 있는 입력만 주어진다. 출력 한 줄에 하나씩, 증가하는 순서대로 소수를 출력한다. 예제 입력 3 16 예제 출력 3 5 7 11 13 💡이 문제는 에라토스테네스의 체를 활용하지 않으면 시간 초과가 나는 문제이다. 📕에라토스테네스의 체? 간단하게 설명하면 2의 배수를 지우고, 3의 배수를 지우고 ,,, 이렇게 각자의 배수들을 지우는 것이다. 이미 지워진 배수들은 넘어간다. 대신 지우는 범위가 굉장히 중요하다. 지우는 범위에 대한 설명은 아래 글로 대신한다. 1,2,3,5,6,10,15,30이 되겠지만 ..