2020. 12. 23. 14:43ㆍ카테고리 없음
데이터 분석 & 시각화
numpy
numpy는 행렬(다차원 배열)을 다루는 패키지이다.
데이터 분석이나 머신 러닝을 할 때 사용된다
공식 홈페이지: https://numpy.org/
pandas
pandas는 데이터를 쉽게 다룰 수 있는 테이블 형식으로 만들어 준다.
데이터 분석이나 머신 러닝을 할 때 사용된다.
공식 홈페이지: https://pandas.pydata.org/
시각화
matplotlib
matplotlib은 데이터 시각화 패키지이다.
그래프를 matplotlib으로 그릴 수 있다.
공식 홈페이지: https://matplotlib.org/
seaborn
seaborn은 matplotlib를 기반으로 한 시각화 패키지이다.
matplotlib 보다 간단한 문법을 사용해서 그레프를 그릴 수 있다
공식 홈페이지: https://seaborn.pydata.org/
머신 러닝
sklearn
sklearn은 머신 러닝 라이브러리이다.
공식 홈페이지: https://scikit-learn.org/stable/
tensorflow, pytorch, keras
딥러닝 라이브러리다.
공식 홈페이지
텐서플로우 : https://www.tensorflow.org/?hl=ko
파이토치 : https://pytorch.org/
케라스 : https://keras.io/
nltk
nltk는 자연어 처리 라이브러리이다.
공식 홈페이지: https://www.nltk.org/
웹 크롤링 및 자동화
requests
requests는 파이썬의 http 패키지다.
공식 홈페이지: https://requests.readthedocs.io/en/master/
selenium
selenium은 웹 브라우저 동작을 자동화해 주는 패키지이다
공식 웹사이트: https://github.com/SeleniumHQ/selenium/
가이드: https://selenium-python.readthedocs.io/
beautifulsoup4
beautifulsoup4는 html 또는 xml을 파싱하는 패키지다.
보통 웹 스크레이핑(web scraping) 즉 클롤링에 많이 사용된다
공식 홈페이지: https://www.crummy.com/software/BeautifulSoup/bs4/doc/