Python中数据挖掘常用模块

基本模块: NumPy,Pandas ,SciPy ,scikit-learn。

其他常用模块:

Theano:Python库,用来定义、优化和模拟数学表达式计算,用于高效地解决多维数组的计算问题以及深度学、框架。

Keras:基于Theano的深度学习库,主要用于搭建人工神经网络、自编码器、卷积神经网络等深度学习模型。

Gensim:Python自然语言处理模块,包括自然语言主题模型,用于文本的主题挖掘。

StatsModels:注重数据统计建模分析的数据处理模块,与Pandas结合,强大的数据挖掘组合。

NLTK:(natural language toolkit)Python自然语言处理模块,包括一系列的字符处理和语言统计模型。常用于学术研究和教学,应用领域有语言学、认知科学、人工智能、信息检索、机器学习等。

Mlpy:基于NumPy和SciPy的机器学习模块,CPython的拓展应用。

PyBrain:Python机器学习模块,用于处理神经网络、强化学习、无监督学习、进化算法。

Milk:Python机器学习工具箱,重点提高监督分类法与几种有效的分类分析:SVMs,kNN,随机森林和决策树等。

Pattern: Python的web挖掘模块,绑定了Google、Twitter、Wikipedia API,提供网络爬虫、HTML解析功能,文本分析包括浅层规则解析、WordNet接口、句法与语义分析、TF-IDF、LSA等,还提供聚类、分类和图网络可视化的功能。

Orange:基于组件的数据挖掘和机器学习软件套装,它功能友好强大,拥有快速而多功能的可视化编程前端,以便浏览数据分析和可视化,且绑定了Python已进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据账目、过渡、建模、模式评估和勘探的功能。

MXNet:深度学习最新框架,性能和速度超越Theano。

XGBoost:是一个速度快、效果好的boosting模型,被封装成了Python模块。该模块能够自动利用CPU的多线程进行并行,同时提高了算法的精度。

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
YOLO高分设计资源源码,详情请查看资源内容使用说明 YOLO高分设计资源源码,详情请查看资源内容使用说明 YOLO高分设计资源源码,详情请查看资源内容使用说明 YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明YOLO高分设计资源源码,详情请查看资源内容使用说明

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值