본문 바로가기

공부21

R프로그래밍 강좌 - [13] [기초통계] 확률개념, 추론 통계학 1. 확률 개념 (1) 통계학에 확률이 필요한 이유 - 통계학을 수학적으로 분석하는 데는 확률이 필요하다. - 표본으로 부터 모집단의 특징을 추론할때 확률이 필요하다. 1) 전수조사와 표본조사 - 전수조사(전체 조사) : 대상 모두를 조사함, 오차 없이 정확하게 결과가 얻어지는 반면 막대한 비용과 수고가 따른다. - 표본조사(샘풀 조사) : 대상의 일부를 추출해 조사함, 일부를 조사해서 그 전체를 추정하는 방법, 일부를 표본이라 하고 전체를 모집단이라 한다. 전수조사에 비해 수고나 비용을 줄일 수 있으나 표본의 선택 방법에 따라 오차(표본오차)가 생김, 2) 표본선택, 표본오차 - 표본조사에서는 전체(모집단)에서 표본을 추출해 모집단을 추정한다. 표본은 무작위로 추출한다. - 모집단에서 복수의 표본을 무.. 2018. 1. 16.
R프로그래밍 강좌 - [12] [기초통계] 기술 통계학 1. 통계학의 종류 (1) 기술 통계학 - 데이터를 요약해 설명하는 통계기법이다. - 자료를 분석하려면 수많은 숫자와 문자의 이면에 있는 경향이나 특징을 파악해야한다. 이를 위해 수집한 자료를 정리해 표로 나타내야 하는데 이를 기술 통계학이라 한다. - 기술통계학에서는 자료정리를 표로 나타내며 자료의 제시는 그래프로 표현한다. 1) 비율 - 전체에서 개개의 요소가 어느 정도의 비율을 차지하는가를 보면 그 요소의 중요성이나 영향력을 알 수있다. - 주로 백분율로 나타낸다. 띠그래프, 누적 막대그래프, 원그래프로 항목들을 표현한다. ※ 띠그래프 ?mtcarsattach(mtcars)par(mfrow=c(2,2))stripchart(hp) #method="overplot" (디폴트)stripchart(gear.. 2018. 1. 15.
R프로그래밍 강좌 - [11] [기초통계] 도수분포,상대도수분포,분활표 1. 기초통계 - 통계에서 데이터를 표로 잘 정리하는 것은 통계전체 작업에서 50%이상을 완성했음을 의미한다. - 표로 데이터가 정리되면 통계적 해석이 쉽고, 그래프로도 나타내기 쉽다. (1) 명목형 변수의 도수분포표 - No, Yes의 답변이 흩어져있는 자료들은 표로 정리한다. - 측정된 값을 카운트해서 정리하는 표를 도수분포표 한다. - 도수의 의미는 거듭하는 횟수이며, 도수분포표는 수량을 세어 나타낸 표라 한다. - Yes, No는 명목변수이다. (2) 명목형 변수의 상대도수분포표 - 커피의 종류 아메리카노, 카라멜 마끼야또, 더치, 카페라떼, 오늘의 커피, 초코렛 프라프치노 등 변수값이 많을 경우에는 월판매 도수분포표는 서로 비교가 쉽지 않다. - 판매비율을 추가하면 숫자만 보는것보다 훨씬 비교가.. 2018. 1. 15.
R프로그래밍 강좌 - [10] [실습] 인터랙티브 그래프 1. 인터랙티브 그래프 - 마우스 움직임에 반응하여 실시간으로 형태가 변하는 그래프이다. - 그래프를 자유롭게 조절하면서 관심있는 부분을 자세히 살펴볼 수 있다. - html로 저장하여 웹 브라우저를 이용해서 그래프를 자유롭게 조작하면서 살펴볼 수 있다. (1) plotly 패키지로 인터랙티브 그래프 생성 1) 산점도 인터랙티브 그래프 생성 - plotly 패키지 설치 및 로딩 - ggplot2로 만든 그래프 plotly 패키지의 ggplotly()함수로 인터그랙티브 그래프를 만든다. - mpg데이터를 이용하여 x축 displ(배기량), y축 hwy(고속도로 연비)를 지정하여 산점도 생성한다. - drv(구동방식)별 색상을 표현하기 위해 col=drv를 지정한다. install.packages("plot.. 2018. 1. 8.