python数据分析总结


本文实验环境、工具:anoconda,Jupyter notebook,python3.6

NumPy基础

NumPy (Numerical Python) 是Python关于数值计算最重要的基础包,可以构建科学计算的库包。
NumPy主要功能:
1.ndarry,具有矢量算数运算和复杂广播能了的多维数组。
2.对整组数据进行快速运算(无需编写循环)
3.用来读写磁盘数据以及操作内存映射文件
4.线性代数、随机数生成和傅里叶变换功能
5.集成由C、C++和Fortran等编写代码的API

其中,NumPy本身没有提供高级的数据分析能力,对于大部分数据分析应用来说,笔者主要研究以下功能:
1.用于数据整理和清理、子集构造和过滤、转换等快速的矢量化数组运算。
2.常用的数组算法:排序、唯一化、集合运算等。
3.高效的描述统计和数据聚合/摘要运算。
4.用于异构数据集的合并/连接运算的数据对齐和关系型数据运算。
5.将条件逻辑表述为数组表达式(非if-elif-else分支循环)。
6.数据的分组运算(聚合、转换、函数应用)

NumPy的ndarray:一种多维数组对象

ndarray[N维数组对象]是NumPy最重要的一个特点,它是一个快速且灵活的大数据集容器。据此,可以对整块数据做一些数学运算。

Numpy的标准使用是import NumPy as np,可以使用from numpy import * 。但由于numpy的命名空间大,包含大量的函数,且其中一些与Python内置函数重名,因此不建议后者写法。

ndarray是一个通用的同构数据多维容器,因此所有元素必须是相同类型,且每个数组都有一个shape(一个表示个维度大小的元祖)和一个dtype(一个用于说明数组类型的对象)



其中表1-1是一些数组创建函数:

函数 说明
array 将输入数据(列表、元组、数组或者其他序列类型)转换成ndarray
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值