https://www.onoffmix.com/event/259676
자연어처리(NLP)시에 doc에서 언급된 단어들의 빈도수를 파악해서 빈도수가 높은 단어일 수록 크게 빈도수가 낮은 단어일 수록 작게 표현하는 시각화 기법.
wordcloud
matplotlib
1
2
|
pip install wordcloud
pip install matplotlib
|
cs |
1. 텍스트 가져오기
In :
1
|
text = "파이썬 워드클라우드 파이썬 좋아 워드클라우드 파이썬 라이브러리 좋아 파이썬 워드클라우드 예시 워드클라우드 우한 폐렴 조심 데이터 분석 우한 워드클라우드 중국 박쥐 감염 코로나바이러스"
|
cs |
2. wordcloud 생성
In :
1
2
3
4
|
import wordcloud import WordCloud
import matplotlib.pyplot as plt
wordcloud = WordCloud(font_path='font/NanumGothic.ttf', background_color='white').generate(text)
|
cs |
※ WordCloud 옵션 정리
font_path | 한글의 경우 깨지지 않게 폰트 경로 지정 |
background_color | 백그라운드 색 지정 |
stopwords | 불용어 지정 |
3. 이미지 출력 및 저장
In :
1
2
3
4
5
|
plt.figure(figsize=(22,22)) #이미지 사이즈 지정
plt.imshow(wordcloud, interpolation='lanczos') #이미지의 부드럽기 정도
plt.axis('off') #x y 축 숫자 제거
plt.show()
plt.savefig()
|
cs |
※ imshow옵션 정리
interpolation 옵션 값
Out :
4. 불용어 지정
In:
1
2
3
4
5
6
7
|
from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyplot as plt
stopwords = set(STOPWORDS)
stopwords.add('워드클라우드')
wordcloud = WordCloud(font_path='font/NanumGothic.ttf',stopwords=stopwords,background_color='white').generate(text)
|
cs |
Out:
python을 활용한 비트코인 가격 분석 (비트코인은 여름에 폭락, 겨울에 떡상) (0) | 2021.11.29 |
---|---|
실전 데이터 분석#2 - 제네시스 GV80 대중 반응 센티멘트 분석(1/3) (0) | 2020.01.26 |
실전 데이터 분석#1 - 서울시 장애인 콜택시 이용 만족도 분석(2/2) (0) | 2019.12.31 |
자연어처리(NLP) - 컴퓨터가 자연어를 이해하는 방법(벡터화) (0) | 2019.12.16 |
실전 데이터 분석#1 - 서울시 장애인 콜택시 이용 만족도 분석(1/2) (0) | 2019.07.21 |