1. 그래프 함수 활용
(1) 기본적인 그래프 함수
1)고수준 그래프 함수
- 새로운 그래프를 시작한다. 그래픽스 창을 초기 생성 하거나 설정하고, 축적을 설정한다.
이후 제목과 라벨 등 장식을 넣을 수 있다.
- 고수준 함수
2)저수준 그래프 함수
- 그래프 작성을 시작할 수 없다. 존재하는 그래프에 점, 선, 텍스트, 장식등을 더한다.
- 저수준 그래프
3) Plot()함수
plot(x,y,main=,sub=,xlab=,type=,axes="",col="", pch="")
- x: x축의 자료
- y: y축의 자료
- main : plot의 전체 제목
- sub : plot의 부 제목
- xlab : x축의 제목, ylab: y축의 제목
- type : plot형태 결정
- axes : plot의 테두리 관련
- col : plot의 색
4) type의 종류
- p : 점
- l : 선
- b : 점과 선
- o : 점을 선이 통과
- h : 수직선으로 된 Histogram
- s : 계단형 그래프
- S : 다른 계단형 그래프
- n : 그래프 없음
5) par()함수
- 그림을 조절하거나 그림창의 특성을 지정하기 위해 사용되는 함수이다.
- 선의굵기와 종류, 문자의 크기와 글꼴, 색깔도 지정 가능하고, 그림의 위치 지정도 가능하다.
- 보통 하나의 plot에 여러창으로 나누어 표시할 때 사용한다.
x<- c(2,5,6,5,7,9,11,5,7,9,13,15,17)
(2) 그래프에 장식하기
1) points()함수
- 그래프에 점을 그리는 함수
points(x, y, pch = , cex = )
- pch="" : ""안에 내용이 바로 출력
- pch=숫자 : 숫자에 해당하는 형태가 출력
- cex=숫자 : 숫자가 클수록 큰 점이 출력
plot(x,y, main="PLOT",sub = "type=n",xlab="x-lab",ylab="y-lab",type="n")
2) lines() 함수
- 선을 그리는 함수이다.
lines(x, lty=,col=,pch=,lwd=)
- lty : 선의 유형
- col : 선의 색상
- lwd : 선의 너비나 두께
plot(x,y, ylim=c(0,20),type="n")
3) text() 함수
- 그래프안에 자신이 원하는 위치에 표시하고 싶은 글자를 입력하는데 사용한다.
- (9,10)지점에 Plotting 글자 넣는다.
4) abline() 함수
- 직선을 그리며 그래프의 원점을 통과하는 수직선 및 수평선을 그리는데 사용한다.
- 그래프 생성함수 호출후 abline()를 호출한다.
5) legend() 함수
- 그래프안에 범례, 즉 그래프의 내용을 해독할 수 있게 해주는 작은 박스나 라벨을 붙이는데 사용되는 함수이다.
- plot() 호출후 legend()를 호출한다.
- legend 유형
점유형에 따른 범례 : legent(x,y,labels, pch=c(점유형1,점유형2, .....))
선유형에 따른 범례 : legent(x,y,labels ,lty=c(선유형1,선유형2, .....))
선두께에 따른 범례 : legent(x,y,labels, lwd=c(두께1,두께2, .....))
색상에 따른 범례 : legent(x,y,labels, col=c(색상1,색상2, .....))
6) curve() 함수
- 곡선을 그릴때 사용합니다.
- 평균이 5, 표준편차 1인 정규분포에서 1000의 샘풀을 생성한다.
2. Plot의 종류
(1) box plot(상자그림)
- 데이터의 세트를 빠르고 쉽게 시각적으로 요약해준다.
- 제1사분위수, 제2사분위수(중앙값), 제3사분위수를 나타낸다.
- 박스위아래의 수염은 이상치를 제외한 데이터 범위이다.
x<- c(2,5,6,5,7,9,11,5,7,9,13,15,17)
(2) 파이차트
- 원형 차트를 사용하면 데이터를 파이의 슬라이스 또는 전체의 일부분으로 시각화 할 수 있다.
- 비율을 나타내기에 더욱 편리한 그래프이다.
z<-c(3.5,1.5,2.3,3.4,6.9)
(3) 막대그래프
- 간단한 막대그래프이다.
- 집단의 평균이나 합계를 막대그래프로 그릴 수 있다.
(4) 히스토그램
- 도수분포를 그림으로 나타낸다.
- 보통 가로축이 계급, 세로축이 도수를 뜻하는 데 반대로 그리기도 한다.
- 계급끼리 서로 붙어있어야 한다.
- hist(x, freq=) freq=T:빈도출력(기본값), freq=F:밀도출력
x<- c(2,5,6,5,7,9,11,5,7,9,13,15,17)
---------------------------------------------------------------------------------
x<- c(2,5,6,5,7,9,11,5,7,9,13,15,17)
-----------------------------------------------------------------------------------
3. ggplot2
- ggplot2를 사용해야 하는이유
ggplot2창시자 : 기본 그래픽 시스템은 그림을 그리기 위해 좋은 툴이지만, ggplot2는 데이터를 이해하는 데
좋은 시각화 툴이다.
(1) ggplot2의 시각화
- ggplot2의 diamonds 데이터로 분포도 그래프 그리기
- 5만 4000여 개의 다이아몬드에 대한 가격을 포함한 10개의 속성정보를 담고 있다.
price(가격),carat(무게),cut(커팅의 가치), colour(다이아몬드 색상),clarity(깨끗함),x(길이),y(너비),z(깊이)
depth(깊이비율),table(가장넓은 부분의 너비 대비 다이아몬드 꼭대기의 너비<-비율로 추정됨)
library(ggplot2)
(2) 회귀곡선 그리기 +goem_smooth()
(3) 회귀곡선 Group 매핑요소
- 전체데이터를 하나의 곡선으로 표시 하고자 할때
ggplot(data=diamonds, aes(x=carat,y=price)) + geom_smooth()
- 회귀곡석을 각 데이터 그룹별로 나누어 표시하고자 할때
ggplot(data=diamonds, aes(x=carat,y=price,group=clarity)) + geom_smooth()
(4) bar plot 그리기
1) 그래프 색 변경
-stat_bin은 연속적인 x 데이터에만 적합합니다.(계급구간지정)
2) 누적 히스토그램 그리기
ggplot(data=diamonds, aes(x=clarity,fill=cut)) + geom_bar()
'공부 > IT-R프로그래밍' 카테고리의 다른 글
R프로그래밍 강좌 - [17][R패키지 활용]텍스트 마이닝, 워드클라우드 (0) | 2018.01.18 |
---|---|
R프로그래밍 강좌 - [18][추론통계학활용]신차 색상 고객 선호도 분석,홍보이벤트 효과 분석 (1) | 2018.01.18 |
R프로그래밍 강좌 - [15] [고급통계] 선형회귀분석, 선형회귀분석 검증, 다중 선형회귀분석 (0) | 2018.01.17 |
R프로그래밍 강좌 - [14] [기초통계] 신뢰구간, 모비율 검정, 정규성 검증, 유의성 검증 (0) | 2018.01.16 |
R프로그래밍 강좌 - [13] [기초통계] 확률개념, 추론 통계학 (0) | 2018.01.16 |
댓글