본문 바로가기
Project/Movie Review Data Visualization

[Project] 영화 리뷰 데이터 감정분석&시각화 - 1. 라이브러리(KoNLPy, wordcloud) 설치

by hotelshoe 2022. 2. 9.
반응형

 

이번 프로젝트는 웹사이트의 영화 리뷰 데이터를 크롤링 해서 분석 및 시각화해보도록 합니다. 개발 언어는 python-3.8을 활용하였고 jupyter notebook 환경에서 실시하였습니다. 프로젝트에 앞서 필요한 라이브러리 설치를 먼저 실시해보도록 하겠습니다.


1.1 라이브러리 및 툴 설치

코드를 작성하는데 앞서 필요한 라이브러리와 툴을 설치하도록 한다.

 

(1) KoNLPy

한국어 정보처리를 위해 필요한 python 패키지로 자연어처리에서 형태소를 분리하기위해 필요한 한국어 데이터 전처리 패키지 입니다. KoNLPy는 자바VM 환경에서 동작하므로 JDK와 JPype 또한 설치가 필요합니다. (일반적인 pip 커맨드로 설치시 오류 발생)

 

a. java JDK 설치

상단 링크를 통해 본인 개발 환경에 맞게 다운로드하면 되겠습니다. 저의 경우 윈도우이므로 

빨간 박스에 해당하는 exe 파일을 다운받았고 절차대로 설치하면 되겠습니다.

설치가 완료되면 환경변수를 지정해야하는데, 윈도우 검색창에 '고급 시스템 설정 보기' 를 검색하거나 '제어판 -> 시스템 및 보안 -> 시스템 -> 고급 시스템 설정' 으로 찾을 수 있습니다.

 

환경변수를 눌러 밑의 시스템 변수를 새로 만듭니다. 변수 이름과 변수 값을 입력하는데 변수 이름은 JAVA_HOME 으로, 변수 값은 java JDK가 설치된 경로를 입력하면 됩니다.

 

다음으로 시스템 변수의 path 변수를 클릭해 편집을 누릅니다.

 

새로 만들기를 클릭하여 %JAVA_HOME%bin 을 입력하고 확인을 누르면 java JDK에 대한 설치는 완료가 됩니다.

설치 완료에 대한 확인은 cmd 창을 열고 밑의 커맨드를 입력해서 확인할 수 있습니다.

java --version

출력 예시

b. JPype 설치

자신의 python 버전에 맞게 하단의 링크에서 다운받을 수 있습니다.

https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpype

 

Python Extension Packages for Windows - Christoph Gohlke

by Christoph Gohlke, Laboratory for Fluorescence Dynamics, University of California, Irvine. Updated on 7 February 2022 at 02:36 UTC. This page provides 32 and 64-bit Windows binaries of many scientific open-source extension packages for the official CPyth

www.lfd.uci.edu

JPype 항목을 찾고, 저의 경우 윈도우 환경의 python 3.8 버전을 사용하므로 빨간 박스된 파일을 다운 받았습니다.

다운로드 후 아래의 pip 커맨드를 통해 설치를 마무리합니다.

pip install C:\.\JPype1-1.1.2-cp38-cp38-win_amd64.whl #-- 설치 경로와 자신이 다운받은 파일명에 맞게 수정할 것

pip install C:\Users\Desktop\movie_review_test\JPype1-1.1.2-cp38-cp38-win_amd64.whl #-- 예시

 

이제 KoNLPy를 설치하기 위한 모든 준비가 끝났으며 하단의 커맨드로 설치를 진행합니다.

pip install konlpy

 

(2) wordcloud 설치

이번 감정분석을 위한 데이터의 경우 단어들을 이용하기 때문에 이를 중요도나 빈도수에 따라 시각적으로 배치하기 위해 필요한 라이브러리 입니다. 

pip install wordcloud

pip 커맨드로 간단하게 다운받을 수 있지만 오류가 많다는 여러 리뷰를 보았고 저 또한 오류가 생겨 권장드리지 않는 방법이므로, 아래 링크를 통해 자료를 다운받아 설치하기를 권장합니다.

https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud

 

Python Extension Packages for Windows - Christoph Gohlke

by Christoph Gohlke, Laboratory for Fluorescence Dynamics, University of California, Irvine. Updated on 7 February 2022 at 02:36 UTC. This page provides 32 and 64-bit Windows binaries of many scientific open-source extension packages for the official CPyth

www.lfd.uci.edu

마찬가지로 저의 경우 윈도우 환경의 python 3.8 버전이므로 wordcloud-1.8.1-cp38-cp38-win_amd64.whl 를 다운받았습니다.

pip install C:\.\wordcloud-1.8.1-cp38-cp38-win_amd64.whl #-- 파일 경로에 맞게 수정할 것

그 후 커맨드를 입력하여 설치를 마무리합니다.

여기까지 필요한 환경 설정은 마무리하고 그 외 기타 필요한 라이브러리는 코드를 작성하면서 추가하겠습니다.

반응형

댓글