python哪些模块用于数据分析_python 大数据分析模块有哪些

1、python下的数据分析模块

pandas:依赖于numpy和sciepy,主要用于数据分析,数据预处理以及基本的作图,这个包不涉及复杂的模型。

statsmodels:统计包,设计各种统计模型,包括回归、广义回归、假设检验等,结果类似于R语言,会给出各种检验结果。

对于numpy和scipy是作为科学计算用的,提供各种向量矩阵计算、优化、随机数生成等等。

以上都是一些包,如果是分析环境的话,可以考虑spyder和ipython notebook——其中ipython notebook 是可以把代码、结果以及报告同时结合在一起的东西——类似于R语言的Rmarkdown。

2、python的数据可视化

最常用的matplotlib,用于科学制图——基础的绘图,已经集成在pandas里。此外,ggplot2在R语言下的绘图神器,也同时支持python的哟,非常推荐。

3、数据存储

一般都用数据库吧。如果怕麻烦,用cPickle直接把数据保存成文本,下次使用直接load就可以。此外,python是内置了spqlite3数据库的,可以直接使用。对于复杂的数据,可以使用数据库接口——各种的,包括hadoop。

作者:关丹辉

链接:https://www.zhihu.com/question/20408598/answer/25751602

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值