khann's IT와 경제 블로그

반응형

python에서 워드클라우드 만드는 방법 정리

 

https://www.onoffmix.com/event/259676

 

[비트코인] 비트코인의 중요성과 미래 세미나

세상의 모든 모임 '온오프믹스'

www.onoffmix.com

워드클라우드 Worldcloud 란?

자연어처리(NLP)시에 doc에서 언급된 단어들의 빈도수를 파악해서 빈도수가 높은 단어일 수록 크게 빈도수가 낮은 단어일 수록 작게 표현하는 시각화 기법.

 

 

필요 라이브러리

wordcloud

matplotlib

 

라이브러리 설치

1
2
pip install wordcloud
pip install matplotlib
cs

 

워드클라우드 만들기

1. 텍스트 가져오기

In :

1
text = "파이썬 워드클라우드 파이썬 좋아 워드클라우드 파이썬 라이브러리 좋아 파이썬 워드클라우드 예시 워드클라우드 우한 폐렴 조심 데이터 분석 우한 워드클라우드 중국 박쥐 감염 코로나바이러스"
cs

 

 

2. wordcloud 생성

In :

1
2
3
4
import wordcloud import WordCloud
import matplotlib.pyplot as plt
 
wordcloud = WordCloud(font_path='font/NanumGothic.ttf', background_color='white').generate(text)
cs

 

※ WordCloud 옵션 정리

font_path 한글의 경우 깨지지 않게 폰트 경로 지정
background_color  백그라운드 색 지정
stopwords  불용어 지정

 

 

3. 이미지 출력 및 저장

In : 

1
2
3
4
5
plt.figure(figsize=(22,22)) #이미지 사이즈 지정
plt.imshow(wordcloud, interpolation='lanczos'#이미지의 부드럽기 정도
plt.axis('off'#x y 축 숫자 제거
plt.show() 
plt.savefig()
cs

 

 

※ imshow옵션 정리

interpolation 옵션 값

 

Out : 

 

 

 

4. 불용어 지정

In:

1
2
3
4
5
6
7
from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyplot as plt 
 
stopwords = set(STOPWORDS) 
stopwords.add('워드클라우드'
 
wordcloud = WordCloud(font_path='font/NanumGothic.ttf',stopwords=stopwords,background_color='white').generate(text)
cs

 

 

 

Out:

 

반응형

이 글을 공유합시다

facebook twitter googleplus kakaostory naver