본문 바로가기

데이터분석2

[Scikit learn] 머신러닝 기초 잡기 - 1. 데이터 분석 내가 보려고 만든 머신 러닝 기초 다잡기 데이터셋은 하단 URL을 통해 다운로드 https://www.kaggle.com/datasets/mathchi/diabetes-data-set Diabetes Dataset This dataset is originally from the N. Inst. of Diabetes & Diges. & Kidney Dis. www.kaggle.com 작성 언어는 Python 3.8이며 주피터 혹은 캐글 노트북 등을 활용하거나, ipynb 확장자의 형태로 편집기를 활용해도 무방 그 외 pandas나 plot의 파라미터의 경우 하단 URL을 참고하였다.(매우 도움이 되었음!) https://wikidocs.net/book/7188 # 0_데이터셋 살펴보기 해당 데이터셋은 Di.. 2023. 1. 30.
[Project] 영화 리뷰 데이터 감정분석&시각화 - 1. 라이브러리(KoNLPy, wordcloud) 설치 이번 프로젝트는 웹사이트의 영화 리뷰 데이터를 크롤링 해서 분석 및 시각화해보도록 합니다. 개발 언어는 python-3.8을 활용하였고 jupyter notebook 환경에서 실시하였습니다. 프로젝트에 앞서 필요한 라이브러리 설치를 먼저 실시해보도록 하겠습니다. 1.1 라이브러리 및 툴 설치 코드를 작성하는데 앞서 필요한 라이브러리와 툴을 설치하도록 한다. (1) KoNLPy 한국어 정보처리를 위해 필요한 python 패키지로 자연어처리에서 형태소를 분리하기위해 필요한 한국어 데이터 전처리 패키지 입니다. KoNLPy는 자바VM 환경에서 동작하므로 JDK와 JPype 또한 설치가 필요합니다. (일반적인 pip 커맨드로 설치시 오류 발생) a. java JDK 설치 https://www.oracle.com.. 2022. 2. 9.
반응형