본문 바로가기

텍스트마이닝14

R프로그래밍 강좌 - [09] [실습] 지도 시각화 1. 지도 시각화 - 지도에 지역별 특성을 색깔로 표현한 지도를 단계 구분도라 한다. - 단계 구분도를 보면 인구나 소득 같은 특성이 지역별로 얼마나 다른지 쉽게 이해할수 있다. (1) 미국 주별 강력 범죄율 단계 구분도 만들기 1) 데이터 준비 - 단계 구분도는 ggiraphExtra 패키지를 이용해 만든다. - R에 내장된 USArrests데이터는 1973년 미국 주(State)별 강력 범죄율 정보를 담고 있다. install.packages("ggiraphExtra")library(ggiraphExtra) > str(USArrests)'data.frame': 50 obs. of 4 variables: $ Murder : num 13.2 10 8.1 8.8 9 7.9 3.3 5.9 15.4 17.4 .. 2018. 1. 8.
R프로그래밍 강좌 - [08] [실습]텍스트 마이닝 R프로그래밍 강좌 - [08] [실습]텍스트 마이닝1. 텍스트 마이닝 - 텍스트 마이닝(Text mining) : 문자로 된 데이터에서 가치 있는 정보를 얻어내는 분석기법 - 형태소 분석(Morephology Analysis) : 텍스트 마이닝 할때 가장 먼저 하는 작업, 어절들의 품사 파악 - 형태소 분석으로 어절들의 품사를 파악후 명사,동사, 형용사 등 의미를 지닌 품사의단어를 추출해 각 단어가 얼마나 많이 등장했는지 확인하다. (1) 힙합가사 텍스트 마이닝 1) 패키지 준비 - 한글 자연어 분석 패키지인 KoNLP(Korean Natural Language Processing)를 이용하면 한글 데이터로 형태소를 분석할 수 있다. - KoNLP는 자바가 설치 되어있어야 한다. 자바 설치후 환경변수 설.. 2017. 10. 25.