Python常用机器学习库

本文介绍了Python中的一些重要机器学习库,如Scikit-Learn、Statsmodels、PyMC、Shogun、Gensim和Orange等,涵盖了从统计模型、贝叶斯分析到深度学习的多个领域。每个库的特点、用途和适用场景都有详细描述,强调了库之间的一致性API、数据处理集成以及与其他科学计算库的配合。
摘要由CSDN通过智能技术生成

计算机视觉、人工智能、数学、天文等。
它同样适用于机器学习也是意料之中的事。
这篇文章就列举并描述Python的最有用的机器学习工具和库。
这个列表中,我们不要求这些库是用Python写的,只要有Python接口就够了。
我们的目的不是列出Python中所有机器学习库(搜索“机器学习”时Python包索引(PyPI)返回了139个结果),

而是列出我们所知的有用并且维护良好的那些。
另外,尽管有些模块可以用于多种机器学习任务,
我们只列出主要焦点在机器学习的库。

比如,虽然Scipy1包含一些聚类算法,但是它的主焦点不是机器学习而是全面的科学计算工具集。
因此我们排除了Scipy(尽管我们也使用它!)。
另一个需要提到的是,我们同样会根据与其他科学计算库的集成效果来评估这些库,
因为机器学习(有监督的或者无监督的)也是数据处理系统的一部分。
如果你使用的库与数据处理系统其他的库不相配,
你就要花大量时间创建不同库之间的中间层。在工具集中有个很棒的库很重要,
但这个库能与其他库良好集成也同样重要。
如果你擅长其他语言,但也想使用Python包,
我们也简单地描述如何与Python进行集成来使用这篇文章列出的库。

Scikit-Learn
Scikit Learn7是我们在CB Insights选用的机器学习工具。
我们用它进行分类、特征选择、特征提取和聚集。
我们最爱的一点是它拥有易用的一致性API,并提供了很多开箱可用的求值、
诊断和交叉验证方法(是不是听起来很熟悉?Python也提供了“电池已备(译注:指开箱可用)”的方法)。
锦上添花的是它底层使用Scipy数据结构,
与Python中其余使用Scipy、Numpy、Pa

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值