좋아하는 것_매직IT/25.R 썸네일형 리스트형 텍스트 마이닝과 워드클라우드를 활용한 빈번하게 사용된 단어 한눈에 알아보기 텍스트 마이닝(Text mining)에 대해서 간단하게 정리해보자면요. 텍스트 마이닝은 문자로 된 데이터에서 가치있는 정보를 얻어내는 분석기법을 말합니다. 그럼 텍스트 마이닝을 하려면 어떻게 해야 할까요? 우선, 문장을 구성하는 어절들이 어떤 품사로 되어 있는지 파악을 해야하는데요... 이것을 우리는 보통 "형태소 분석(Morphology Analysis)" 이라고 말을 하곤 하지요... 형태소 분석으로 어절들의 품사를 파악한 후 명사,동사, 형용사 등 의미를 지닌 품사의 단어들을 추출해 각 단어가 얼마나 많이 등장했는지 확인하면 되고요.. 텍스트 마이닝을 이용해서 SNS 나 웹사이트에 올라온 글을 분석하면 사람들이 어떤 이야기를 나누고 있는 한눈에 파악할 수 있습니다. 그럼, 텍스트 마이닝을 하기 위해.. 더보기 R언어에서 파생변수 만드는 방법 (feat. 리워드 비율 정하는 한가지 방법) 블로그 목적 - R언어에서 파생변수 만드는 방법을 공유한다. 블로그 요약 - 하나, 파생변수란 무엇인지에 대해서 알아본다. - 둘, R언어에서 파생변수를 만드는 방법을 알아본다. - 셋, 생성한 파생변수를 통해서 데이터를 분석및 이용해 본다. 블로그 상세 내용 우선 파생변수란 무엇일까요? - 파생변수(Derived Variable)라는 개념은 기존의 변수를 변형해 만드는 변수를 말하는데요... 갑자기 어느날, 우리에게 어떤 수치값을 가지고 분석해야하는 미션이 갑자기 주어져서, 그 부분을 생각해 봐야 한다고 가정해 보시죠? "아 몰랑!! 생각하기 시로!" 하며... - 그냥 아무런 고민과 생각없이 나에게 주어진 변수 값을 가지고 해당 수치값을 분석하는 방법을 택할 수 있습니다. 하지만, 우리는 모든 일들을.. 더보기 이전 1 다음