[파이썬 Python] 패키지

2020. 12. 23. 14:43카테고리 없음

728x90
반응형

데이터 분석 & 시각화


numpy

numpy는 행렬(다차원 배열)을 다루는 패키지이다.

데이터 분석이나 머신 러닝을 할 때 사용된다

 

공식 홈페이지: https://numpy.org/

pandas

pandas는 데이터를 쉽게 다룰 수 있는 테이블 형식으로 만들어 준다.

데이터 분석이나 머신 러닝을 할 때 사용된다. 

공식 홈페이지: https://pandas.pydata.org/

 

시각화


matplotlib

matplotlib은 데이터 시각화 패키지이다.

그래프를 matplotlib으로 그릴 수 있다.

공식 홈페이지: https://matplotlib.org/

seaborn

seaborn은 matplotlib를 기반으로 한 시각화 패키지이다.

matplotlib 보다 간단한 문법을 사용해서 그레프를 그릴 수 있다

 

공식 홈페이지: https://seaborn.pydata.org/

 

 

머신 러닝


sklearn

sklearn은 머신 러닝 라이브러리이다.

 

공식 홈페이지: https://scikit-learn.org/stable/

tensorflow, pytorch, keras

딥러닝 라이브러리다.

 

공식 홈페이지

텐서플로우 : https://www.tensorflow.org/?hl=ko

파이토치 : https://pytorch.org/

케라스 : https://keras.io/

nltk

nltk는 자연어 처리 라이브러리이다.

 

공식 홈페이지: https://www.nltk.org/

 

 

웹 크롤링 및 자동화


requests

requests는 파이썬의 http 패키지다. 

 

공식 홈페이지: https://requests.readthedocs.io/en/master/

selenium

selenium은 웹 브라우저 동작을 자동화해 주는 패키지이다

 

공식 웹사이트: https://github.com/SeleniumHQ/selenium/

가이드: https://selenium-python.readthedocs.io/

beautifulsoup4

beautifulsoup4는 html 또는 xml을 파싱하는 패키지다.

보통 웹 스크레이핑(web scraping) 즉 클롤링에 많이 사용된다

 

공식 홈페이지: https://www.crummy.com/software/BeautifulSoup/bs4/doc/

 

 

반응형