数据科学中常用的python库介绍

常用库


  • Numpy
  • Scipy
  • Pandas
  • Matplotlib
  • Scikit-learn
  • StatsModels

Numpy


最基础的python库,它提供以下功能和特点:

  • N维数组,快速高效,矢量数学运算
  • 高效的Index,不需要循环
  • 开源免费跨平台,底层C实现,运行效率媲美C/Matlab

Scipy


它是一个依赖于Numpy的一个更高级的python库,专门为工程和科学设计,提供了线性代数、傅里叶变换、信号和图像处理的多种算法。

Pandas


提供了结构化数据分析的功能,依赖于Numpy,提供了如下的数据结构:
- 时间序列:Time-series
- DataFrame
- Panel

同时提供了强大的数据索引和处理能力

Matplotlib


它是python 2D绘图领域使用最广泛的套件,基本能取代Matlab的绘图功能(散点、曲线、柱形等)。

通过扩展mploy3d可以绘制精美3D图像。

Scikit-learn


python中用于机器学习的模块,基于Scipy上,提供了常用的机器学习的算法:聚类、回归等,具有简单易学的API接口。

StatsModels


StatsModels更加注重于数据的统计分析建模,它使得python具有了R语言的味道。StatsModels支持与pandas进行数据交互,因此它和pandas组合成为了强大的数据挖掘组合。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值