[파이썬 Python] 패키지

2020. 12. 23. 14:43ㆍ카테고리 없음

728x90

데이터 분석 & 시각화

numpy

numpy는 행렬(다차원 배열)을 다루는 패키지이다.

데이터 분석이나 머신 러닝을 할 때 사용된다

공식 홈페이지: https://numpy.org/

pandas

pandas는 데이터를 쉽게 다룰 수 있는 테이블 형식으로 만들어 준다.

데이터 분석이나 머신 러닝을 할 때 사용된다.

공식 홈페이지: https://pandas.pydata.org/

시각화

matplotlib

matplotlib은 데이터 시각화 패키지이다.

그래프를 matplotlib으로 그릴 수 있다.

공식 홈페이지: https://matplotlib.org/

seaborn

seaborn은 matplotlib를 기반으로 한 시각화 패키지이다.

matplotlib 보다 간단한 문법을 사용해서 그레프를 그릴 수 있다

공식 홈페이지: https://seaborn.pydata.org/

머신 러닝

sklearn

sklearn은 머신 러닝 라이브러리이다.

공식 홈페이지: https://scikit-learn.org/stable/

tensorflow, pytorch, keras

딥러닝 라이브러리다.

공식 홈페이지

텐서플로우 : https://www.tensorflow.org/?hl=ko

파이토치 : https://pytorch.org/

케라스 : https://keras.io/

nltk

nltk는 자연어 처리 라이브러리이다.

공식 홈페이지: https://www.nltk.org/

웹 크롤링 및 자동화

requests

requests는 파이썬의 http 패키지다.

공식 홈페이지: https://requests.readthedocs.io/en/master/

selenium

selenium은 웹 브라우저 동작을 자동화해 주는 패키지이다

공식 웹사이트: https://github.com/SeleniumHQ/selenium/

가이드: https://selenium-python.readthedocs.io/

beautifulsoup4

beautifulsoup4는 html 또는 xml을 파싱하는 패키지다.

보통 웹 스크레이핑(web scraping) 즉 클롤링에 많이 사용된다

공식 홈페이지: https://www.crummy.com/software/BeautifulSoup/bs4/doc/

저작자표시 비영리 변경금지 (새창열림)

_by_