(1)核心库与统计:Numpy、Scipy、Pandas、StatsModels。
(2)可视化:Matplotlib、Seaborn、Plotly、Bokeh、Pydot、Scikit-learn、XGBoost/LightGBM/CatBoost、Eli5。
(3)深度学习:Tensorflow、PyTorch、Keras。
(4)分布式深度学习:Dist-keras/elephas/spark-deep-learning。
(5)自然语言处理:NLTK、SpaCy、Gensim。
(6)数据抓取:Scrapy。