深度学习
-
TensorFlow(https://github.com/tensorflow/tensorflow)
TensorFlow 是一个用于机器学习的端到端的开源平台。它具备着全面综合的、灵活的工具、库和社区资源生态系统,可以帮助研究人员去推动机器学习先进的技术的发展,并让开发人员可以轻松地构建和部署基于机器学习的应用程序。 -
Keras(https://github.com/keras-team/keras)
Keras 是一个用 Python 编写的深度学习 API,其运行于机器学习的顶级平台 TensorFlow 之上。 -
PyTorch(https://github.com/pytorch/pytorch)
具有强大 GPU 加速,和使用 Python 实现的张量和动态神经网络。 -
fastai(https://github.com/fastai/fastai)
通过利用当下最佳的技术实践,fastai 极快地简化了训练过程,并加速了神经网络。 -
PyTorch Lightning(https://github.com/PyTorchLightning/pytorch-lightning)
针对于高性能人工智能研究的封装轻量级 PyTorch。可以缩小你的模型,而不是提供小的样板。 -
JAX(https://github.com/google/jax)
Python+NumPy 程序的可组合转换:区分,向量化,在 GPU/TPU 上的 JIT,等等。 -
MXNet(https://github.com/apache/incubator-mxnet)
带有动态和突变感知的数据流管理调度程序的轻量、便捷、灵活的分布式 / 移动机器学习库:支持 Python、R、Julia、Scala、Go、JavaScript 等等。 -
Ignite(https://github.com/pytorch/ignite)
高级库,可以帮助培训和评估神经网络在 PyTorch 中实现灵活和透明的使用。
自然语言处理
-
FastText(https://github.com/facebookresearch/fastText)
fastText 是一个可以用来高效学习单词表意和句子分类的库。 -
spaCy(https://github.com/explosion/spaCy)
用来实现工业级自然语言处理 (NLP),通过使用 Python 和 Cython。 -
gensim(https://github.com/RaRe-Technologies/gensim)
Gensim 是一个 Python 库,用于主题建模、文档索引和相似度检索,具有大型语料库。目标受众是自然语言处理 (NLP) 和信息检索 (IR) 社区。 -
NLTK(https://github.com/nltk/nltk)
NLTK—— 自然语言工具箱 —— 是一套开源 Python 模块、数据集和教程,用于针对支持自然语言处理方面的研究和开发。 -
Datasets (Huggingface)(https://github.com/huggingface/datasets)
用于自然语言处理的,使用 PyTorch, TensorFlow, NumPy 和 Pandas 的工具,具有快速,高效,开放访问的数据集和自然语言处理评估指标。 -
Tokenizers (Huggingface)(https://github.com/huggingface/tokenizers)
为研究和生产优化的快速、顶级的分词器。 -
Transformers (Huggingface)(https://github.com/huggingface/transformers)
transformer: 针对 Pytorch 和 TensorFlow 2.0 的最顶级的自然语言处理库。 -
Stanza(https://github.com/stanfordnlp/stanza/)
针对许多人类语言的正式标准 NLP Python 库。 -
TextBlob(https://github.com/sloria/textblob)
简单、python 风格、文本处理 —— 情感分析、词性标记、名词短语提取、翻译等等。 -
PyTorch-NLP(https://github.com/PetrochukM/PyTorch-NLP)
PyTorch 自然语言处理 (NLP) 的基本工具。 -
Textacy(https://github.com/chartbeat-labs/textacy)
一个 Python 库,用于执行各种自然语言处理 (NLP) 任务,构建在一个高性能 spaCy 库之上。 -
Finetune(https://github.com/IndicoDataSolutions/finetune)
Finetune 是一个库,它允许用户利用最先进的预训练的 NLP 模型来执行广泛的下游任务。 -
TextHero(https://github.com/jbesomi/texthero)
文本预处理,表示和可视化,从零到精通。 -
Spark NLP(https://github.com/JohnSnowLabs/spark-nlp)
Spark NLP 是一个构建在 Apache Spark ML 之上的自然语言处理库。 -
GluonNLP(https://github.com/dmlc/gluon-nlp)
GluonNLP 是一个工具包,它支持简单的文本预处理、数据集加载和神经模型构建,以帮助您加快自然语言处理 (NLP) 研究。
计算机视觉
-
Pillow(https://github.com/python-pillow/Pillow)
Pillow 是对用户十分友好的 PIL 分支。PIL 是 Python 的图像库。 -
OpenCV(https://github.com/opencv/opencv)
开源计算机视觉库。 -
scikit-image(https://github.com/scikit-image/scikit-image)
python 中的图像处理。 -
Mahotas(https://github.com/luispedro/mahotas)
Mahotas 是个包含了最快的计算机视觉算法(所有算法用 C++ 实现保证运行速度)的库,针对 numpy 数组运行。 -
Simple-CV(https://github.com/sightmachine/simplecv)
SimpleCV 是一个开源机器视觉框架,使用 OpenCV 和 Python 编程语言。 -
GluonCV(https://github.com/dmlc/gluon-cv)
GluonCV 提供了计算机视觉中最先进 (SOTA) 深度学习模型的实现。 -
Torchvision(https://github.com/pytorch/vision)
torchvision 包由流行的数据集、模型架构和用于计算机视觉中常见的图像转换方法组成。