루덴스코드 Blog

문재인 대통령의 신년 기자회견문을 워드클라우드로 작성해보았습니다.



결과 그래프에서 보이듯 "국민"이라는 말이 제일 많이 사용되었습니다. 이 부분은 지난 대선 주자 연설문에서 보였던 특징과 동일합니다. "국민"이라는 말을 참 좋아하고 많이 사용하는 것이 문재인 대통령 연설문의 특징입니다. 

물론 이 워드클라우드는 단어의 수를 계수하여 그 비중대로 단어를 화면에 보여주는 것이 전부입니다. 그래서 문맥사이, 단어들 사이에 담겨 있는 깊은 의미를 파악하지는 못합니다. 그 부분은 별도의 기사나 독자들의 해석에 맡깁니다. 여기서는 전문에 드러난 단어의 사용빈도에 따른 중요도를 파악하는 것으로 그치고자 합니다.

이 결과만으로 간단하게 생각해보자면 문재인 대통령은 "국민"을 참 좋아하는 것 같습니다.


이 워드클라우드를 만든 모든 소스는 깃허브에 올려두었습니다. [링크]

이에 사용된 간단한 설치와 소스에 대한 설명은 다음과 같습니다.


윈도우 10 환경

파이썬 3.4

virtualenv 로 가상개발환경

> virtualenv -p c:\python\python34\python.exe myvenv34

> myvenv34\scripts\activate

konlpy, pygame, jupyter 설치 (jupyter notebook 를 사용하지 않는다면 jupyter 는 설치하지 않아도 무방)

(myvenv34)> pip install konlpy pygame jupyter



깃허브에서 wordcloud.py 를 다운받는다.

(myvenv34)> python wordcloud.py



이러면 다음과 같은 결과가 나옵니다. 








Comment +0