본문 바로가기

분류 전체보기102

R프로그래밍 강좌 - [14] [기초통계] 신뢰구간, 모비율 검정, 정규성 검증, 유의성 검증 1. 신뢰구간 - 통계학에선 표본으로 모집단의 성질을 유추한다. 이것을 통계적인 추정이라 한다. - 전국 초등학교 어린이의 한달 용돈의 평균값을 알기 위해 무작위로 뽑은 초등학생 2500명을 조사했다. 평균값이 3000원 표본오차가 5000원 이었다면 , 한달 용돈 평균값를 95%의 정확도(신뢰도)로 추정할 수 있다. - 모집단은 전국 초등학교 어린이들 이고, 표본은 무작위로 뽑은 초등학생 2500명이 된다. - 추정에 사용되는 통계량의 표본분포를 조사하는데, 표본분포에서 그 기댓값을 중심으로 주어진 신뢰도로 통계량이 일어나는 범위를 조사하고 신뢰도 95%가 되는 구간이 얻어지는데 그 구간을 신뢰구간이라 한다. - R의 t.test()로 표본을 이용하여 모집단의 신뢰구간을 추정할 수 있다. - conf... 2018. 1. 16.
R프로그래밍 강좌 - [13] [기초통계] 확률개념, 추론 통계학 1. 확률 개념 (1) 통계학에 확률이 필요한 이유 - 통계학을 수학적으로 분석하는 데는 확률이 필요하다. - 표본으로 부터 모집단의 특징을 추론할때 확률이 필요하다. 1) 전수조사와 표본조사 - 전수조사(전체 조사) : 대상 모두를 조사함, 오차 없이 정확하게 결과가 얻어지는 반면 막대한 비용과 수고가 따른다. - 표본조사(샘풀 조사) : 대상의 일부를 추출해 조사함, 일부를 조사해서 그 전체를 추정하는 방법, 일부를 표본이라 하고 전체를 모집단이라 한다. 전수조사에 비해 수고나 비용을 줄일 수 있으나 표본의 선택 방법에 따라 오차(표본오차)가 생김, 2) 표본선택, 표본오차 - 표본조사에서는 전체(모집단)에서 표본을 추출해 모집단을 추정한다. 표본은 무작위로 추출한다. - 모집단에서 복수의 표본을 무.. 2018. 1. 16.
R프로그래밍 강좌 - [12] [기초통계] 기술 통계학 1. 통계학의 종류 (1) 기술 통계학 - 데이터를 요약해 설명하는 통계기법이다. - 자료를 분석하려면 수많은 숫자와 문자의 이면에 있는 경향이나 특징을 파악해야한다. 이를 위해 수집한 자료를 정리해 표로 나타내야 하는데 이를 기술 통계학이라 한다. - 기술통계학에서는 자료정리를 표로 나타내며 자료의 제시는 그래프로 표현한다. 1) 비율 - 전체에서 개개의 요소가 어느 정도의 비율을 차지하는가를 보면 그 요소의 중요성이나 영향력을 알 수있다. - 주로 백분율로 나타낸다. 띠그래프, 누적 막대그래프, 원그래프로 항목들을 표현한다. ※ 띠그래프 ?mtcarsattach(mtcars)par(mfrow=c(2,2))stripchart(hp) #method="overplot" (디폴트)stripchart(gear.. 2018. 1. 15.
R프로그래밍 강좌 - [11] [기초통계] 도수분포,상대도수분포,분활표 1. 기초통계 - 통계에서 데이터를 표로 잘 정리하는 것은 통계전체 작업에서 50%이상을 완성했음을 의미한다. - 표로 데이터가 정리되면 통계적 해석이 쉽고, 그래프로도 나타내기 쉽다. (1) 명목형 변수의 도수분포표 - No, Yes의 답변이 흩어져있는 자료들은 표로 정리한다. - 측정된 값을 카운트해서 정리하는 표를 도수분포표 한다. - 도수의 의미는 거듭하는 횟수이며, 도수분포표는 수량을 세어 나타낸 표라 한다. - Yes, No는 명목변수이다. (2) 명목형 변수의 상대도수분포표 - 커피의 종류 아메리카노, 카라멜 마끼야또, 더치, 카페라떼, 오늘의 커피, 초코렛 프라프치노 등 변수값이 많을 경우에는 월판매 도수분포표는 서로 비교가 쉽지 않다. - 판매비율을 추가하면 숫자만 보는것보다 훨씬 비교가.. 2018. 1. 15.