机器学习
// 5.Scikit-Learn 库
官网:
https://scikit-learn.org.cn/
特点:
Scikit-learn(以前称为scikits.learn,也称为sklearn)是针对 Python 编程语言的免费软件机器学习库。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度提升,k均值和DBSCAN,并且旨在与 Python 数值科学库 NumPy 和 SciPy 联合使用。
// 6.XGBoost 库
官网:
https://xgboost.ai/
特点:
XGBoost是一个优化的分布式梯度增强库,旨在实现高效,灵活和便携。它在 Boosting框架下实现机器学习算法。XGBoost提供并行树提升(也称为GBDT,GBM),可以快速准确地解决许多数据科学问题。相同的代码在主要的分布式环境(Hadoop,SGE,MPI)上运行,并且可以解决数十亿个示例之外的问题。
// 7.LightGBM 库
官网:
https://lightgbm.readthedocs.io
特点:
LightGBM(Light Gradient Boosting Machine) 是微软开源的一个实现 GBDT 算法的框架,支持高效率的并行训练。LightGBM 提出的主要原因是为了解决 GBDT 在海量数据遇到的问题,让 GBDT 可以更好更快地用于工业实践。其具有以下优点:更快的训练速度、更低的内存消耗、更好的准确率、分布式支持,可以快速处理海量数据。
// 8.CatBoost 库
官网:
https://catboost.ai/
特点:
CatBoost 是由 Yandex 的研究人员和工程师开发的基于梯度提升决策树的机器学习方法,现已开源。CatBoost 在 Yandex 公司内广泛使用,用于排列任务、预测和提出建议。CatBoost 是通用的,可应用于广泛的领域和各种各样的问题。
// 9.Eli5 库
官网:
https://eli5.readthedocs.io
特点:
ELI5 是一个 Python 库,允许使用统一API可视化地调试各种机器学习模型。它内置了对多个ML框架的支持,并提供了一种解释黑盒模型的方法。它有助于调试机器学习分类器并解释它们的预测。
// 10.Theano 库
官网:
https://pypi.org/project/Theano/
特点:
Theano 是一个 Python 库,专门用于定义、优化、求值数学表达式,效率高,适用于多维数组。特别适合做机器学习。一般来说,使用时需要安装 Python 和 Numpy 。
//11.PyBrain库
官网:
https://github.com/pybrain/pybrain/
特点:
PyBrain的概念是将一系列的数据处理的算法封装到被称之为Module的模块中。一个最小的Module通常包含基于机器学习算法的可调整的参数集合。
//12.Shogun库
官网:
https://github.com/shog