Python框架
Flask
Django
爬虫
Scrapy
Beautiful Soup
Beautifu Soup不完全是一套爬虫工具,需要配合urllib使用,而是一套HTML/XML数据分析,清洗和获取工具
文本处理
spaCy
spaCy 是一个Python自然语言处理工具包,诞生于2014年年中,号称“Industrial-Strength Natural Language Processing in Python”,是具有工业级强度的Python NLP工具包。spaCy里大量使用了 Cython 来提高相关模块的性能,这个区别于学术性质更浓的Python NLTK,因此具有了业界应用的实际价值。
NLTK
《Natural Language Processing with Python》
Pattern
TextBlob
Simplified Text Processing, TextBlob stands on the giant shoulders of NLTK and pattern, and plays nicely with both
Gensim
Topic Modeling for Humans
jieba
中文分词
科学计算
Ipython+Numpy+Scipy
可视化
Matplotlib + Seaborn
机器学习 & 数据挖掘
scikit-learn
pandas
《Python for Data Analysis》