본문 바로가기
  • 내 손안 세상 보기 니 해피
IT

Wordcloud 특징과 기능

by 니해피 2024. 5. 24.
반응형

Wordcloud는 텍스트 데이터의 주요 키워드를 직관적으로 파악하고 시각적인 매력적 방식으로 정보 전달하는데 유용한 도구다. 단어들의 시각적 표현을 제공하는 데이터를 시각화해 주는 wordcloud 주요 특징과 기능을 알아보겠다.

 

Wordcloud는 일반적으로 텍스트 데이터에서 자주 등장하는 단어들을 강조하기 위해 사용된다. 마케팅, 교육, 연구등에서 사용할 수 있다.

 

특징

1. 텍스트 데이터에서 각 단어의 빈도수를 기반으로 단어의 크기를 정한다. 자주 등장하는 단어 일 수록 더 크게 표시된다.

2. 다양한 글꼴 색상 레이아웃 옵션을 통하여 시각적으로 매력적인 그래픽을 만들 수 있다.

3. 데이터의 주요 키워드, 주제를 한눈에 파악하는데 도움을 준다.

 

주요 구성 요소

1. 텍스트 데이터 : 분석하고자 하는 뉴스 기사 책 소셜미디어 게시물 등 다양한 출처의 텍스트가 사용될 수 있다.

2. 전처리 : 단어 빈도수를 정확하게 계산하기 위하여 불용어(stopwords) 제거, 소문자 변환, 표준어 추출(lemmatization) 등의 전처리 과정이 필요할 수 있다.

3. 레이 아웃 : 일반적으로 단어들은 무작위로 배치하지만 특정 모양이나 패턴을 따라 배치될 수도 있다.

4. 색상과 글꼴 : 시각적인 효과를 위하여 다양한 색상과 글꼴을 적용할 수 있다.

 

워드크라우드 생성기는 여기[https://wordcloud.kr]에서 다운로드 한다. 다음은 안내되어 있는 워드클라우드 생성기 사용법 이다.

 

[사진출=워드클라우드]

 

글자색 : 다양한 글자색을 선택할 수 있다.

폰트 : 글자 폰트를 선택하여 다양한 글자체를 만들 수 있다.

배경색 : 워드클라우드 배경색을 정할 수 있다.

마스크 : 다양한 모양의 단어 구름을 만들 수 있다. 마스크를 선택하면 이미지 크기는 먹히지 않는다.

이미지 크기 : 워드클라우드 이미지 크기를 정할 수 있다.

최대 단어수 : 크게 나오길 원하는 글자를 3개까지 넣을 수 있으며 키워드는 띄어쓰기 없이 넣는다. 첫 번째 키워드가 가장 크게 나온다.

텍스트 : 내용을 넣으면 단어 구름에 글자들이 나오며 자주 나오는 단어가 크게 나온다. & 는 넣지 않는다.

 

워드클라우드를 만든 다음 '저장 & 공유'를 눌러 저장하거나 친구와 공유할 수 있다.

 

Python을 사용한 Wordcloud생성 예시

from wordcloud import WordCloud
import matplotlib.pyplot as plt

# 예시 텍스트 데이터
text = "Data science is an interdisciplinary field that uses scientific methods, 
processes, algorithms and systems to extract knowledge and insights from noisy, 
structured and unstructured data."

# Wordcloud 생성
wordcloud = WordCloud(width=500, height=400, background_color='white').generate(text)

# Wordcloud 시각화
plt.figure(figsize=(10, 5))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()

code bychatGPT

 

위 코드는 텍스트 데이터를 기반으로 wordcloud를 생성하고 이를 시각화한다. wordcloud 클래스의 다양한 매개변수를 통해 색상 크기 레이아웃을 조정할 수 있다.

 

 

Wordcloud는 고객 피드백을 함에 있어 자주 언급되는 단어를 시각화하여 주요 관심사를 파악 마케팅에 활용하거나, 주제를 시각적으로 표현하여 학생들의 이해를 도울 수 있고, 대규모 텍스트 데이터 연구자료를 분석하여 주제, 키워드파악하는 연구자를 도와줄 수 있어 활용도 높다고 할 수 있다.

필자는 실무에서 빅데이터와 qGIS를 결합하여 브리핑 자료를 만들어 고객과의 미팅에서 사용하고 있다.

 

 

반응형

댓글