pandas 对某一行标准化_3-3-1 初识Numpy和Pandas

54019501800a516e973af776fdc5c5c6.png

426656b1d90e9db1ace80a84a49b4e42.png

当年学Python饶了不少原路,跋山涉水终于到了心目中数据分析的核心区域,接下来要学习的内容对自己来说都是新的知识,打起精神,充满好奇心地探索未知领域。同时,不要忘了学习的初心,是为了早日找到一份理想的数据分析工作,而不只是为了打发时间而学习。

一维数据结构

  • Numpy
    • numpy用array方法来定义一维数组

2a2a37213ba204d3a1af0185f164b035.png
    • numpy一维数组和python的列表类似,以下是相同的部分
      • 查询元素a[0]

ab04d40ba41d2da5602ff6795b378c91.png
      • 切片访问a[1:3]

25dd8bfa26edc4c65f2d0fd93710ec36.png
      • 循环访问for i in a

60f73a3de17a4f515697401e4eaa4546.png
      • 用dtype查看数据类型

2bd668c246b28d83a4a6226bc1c9eea7.png
    • numpy一维数组和python的列表的区别
      • 统计功能。平均值mean(),标准差std()

da108413ba0f8abc51a6b06ffd321287.png
      • 向量化计算。加法和乘法

2c911eca66404b725c0ef768a4da752a.png
      • array类的数据类型必须一致
  • Pandas
    • pandas用series方法来定义一维数组,比numpy功能更多
    • Pandas可以通过index来指定索引

55c918b701d210f0b77c0c4038bdd028.png
    • 用describe来获取描述统计信息

5b4461aa67850beffa7cd3f11d5b943c.png
    • 两种属性获取元素
      • iloc属性根据位置获取值

6796ed57b5481fab6c5bf70e6018a6a0.png
      • loc属性根据定义的索引获取值

fe31693bff3961d809a6d97c0bdaea03.png
    • 如何避免向量计算结果中空值的出现
      • 用dropna方法删除缺失值

30ceb732af4de35e731d7febcbd291b9.png
      • 使用add方法中的fill_value参数,将缺失值进行填充

82872aada4b1568fa440461edeac6f4e.png

二维数据结构(有点类似excel的二维表格)

  • Numpy
    • numpy还是通过array方法来定义二维数组

0d70948598ec1389fc9b403f025aa479.png
    • 查询元素a[0,2]

b7f2f4fb0db7c3f75eb6f4950a36f3a3.png
    • 获取第一行a[0,:]

1cd50843d35de05a6f037b972ae948f1.png
    • 获取第一列a[:,0]

e3ea1b1fa6360d23f9b6212d512e0a77.png
    • 数轴参数
      • Axis=1 按行计算
      • Axis=0 按列计算

cde1dd201d7a33ee2ffd1e9fa3ebb4d6.png
  • Pandas
    • pandas通过dataframe方法来定义二维数组

95e6e1ad4be7518f6d0f86b43a29fd95.png
    • numpy中每个元素都属于同一种类型,在数值计算中有用,但不利于表示excel中的内容
    • pandas的二维数组相比numpy有两个优点
      • 每一列可以是不同数据类型
      • 有索引的功能,行和列都有一个索引值
    • 通过字典传入dataframe,key是每一列的属性,value是每个属性的所有值
    • 为了让列名按照原表顺序,需要导入OrderDict
    • 平均值计算按列来求平均值

163da5137bfa32fbefaa63bd34fbbc13.png
    • 两种方法获取元素
      • iloc方法根据位置获取值

65dc2038d12afbd78ee7f98ebf4ed8e1.png
      • loc根据定义的索引获取值(更常用),理解获取某一个元素,通过行名获取某一行和通过列名获取某一列

04855590d8c4c304ff12339ca2508020.png
    • 查询某几列。a[x,z]查询x和z列
    • 通过切片功能,查询某几列。a.loc[x,z]查询x,y,z列
    • 通过条件判断筛选
      • 构建查询条件
      • 应用查询条件

939d3c165ea591a348a7186671ee0738.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值