워드클라우드1 R프로그래밍 강좌 - [17][R패키지 활용]텍스트 마이닝, 워드클라우드 1.텍스트 마이닝(Text Mining) - tm패키지를 사용하여 텍스트를 분석한다. - tm의 Corpus는 데이터의 정제, 통합, 선택, 변환 과정을 거친 구조화된 단계로서 더 이상 추가적인 절차 없이 데이터 마이닝 알고리즘 실험에서 활용할 수 있는 상태이다. - 텍스트 마이닝 패키지인 tm에서 문서를 관리하는 기본구조를 Corpus라 부르며, 이는 텍스트 문서들의 집합을 의미한다. (1) 데이터 준비 및 패키지 설치 - 실습에 사용할 데이터는 kor.txt이며 코리아 헤럴드의 경제 부분 기사를 텍스트형식으로 만든 데이터이다. - 텍스트 파일은 영어로 구성되어 있으며, 우리나라 경제상황에 대한 내용을 담고 있다. # Installinstall.packages("tm") # for text mining.. 2018. 1. 18. 이전 1 다음