对比excel,轻松学习python数据分析(8:数据运算、9:时间序列)

第八章 数据运算

1.算术运算

  1. 两列相加
  2. 两列相减
  3. 两列相乘
  4. 两列相除
  5. 任意一列加/减一个常数值,这一列中的所有值都加/减这个常数值
  6. 任意一列乘/除一个常数值,这一列中的所有值都乘/除这一常数值

2.比较运算

比较是在列与列之间进行

3.汇总运算

  • count 非空值计算
    1.某一个区域中非空(单元格)数值的个数
    2.直接在整个数据表上调用 count()函数,返回的结果为该数据表中每列的非空值的个数
    3.默认求每一列的非空数值的个数
    4.当axis参数等于1时,求取每一行的非空数值的个数
    5.也可以把某一列或者某一行索引出来,单独查看这一列或这一行的非空值个数

  • sum()求和
    1.整个数据表上调用sum()函数,返回的是该数据表每一列的求和结果

  • mean()求均值
    1.针对某一区域中的所有值进行求算术平均值运算,衡量数据一般情况的指标,容易受到极大值、极小值的影响
    2.对整个表直接调用mean()函数,返回的是该表中每一列的均值
    3.axis 参数等于1,对每一行进行求均值运算。
    4.把某一列或者某一行通过索引的方式取出来,然后在这一行或这一列上调用mean()函数,单独求取这一行或这一列的均值

  • max()求最大值
    比较一组数据中所有数值的大小,然后返回最大的一个值。

  • min()求最小值

  • median() 求中位数

  • mode()求众数
    axis = 1 求每一行的众数
    df[‘XX列名’].mode() 求某一列的众数

  • var()求方差
    axis = 1 求每一行的
    df[‘XX列名’].var() 求某一列的

  • std()求标准差
    axis = 1 求每一行的
    df[‘XX列名’].std() 求某一列的

  • quantile()分位数

4.相关性

  • corr()
    df[‘A’].corr(df[‘B’])
    corr()函数求取整个 DataFrame 表中各字段两两之间的相关性

第九章 时间序列

1.获取当前时间

from datetime import datetime
datetime.now()
datetime.now().year

Python中周几是从0开始数的,周日返回的是6,所以在后面加1

返回周几
返回周数

isocalendar() 返回当前时刻所在周的周数

2.指定日期和时间的格式

3.字符串和时间格式相互转换

str()函数将时间格式转换为字符串格式
parse()函数将字符串格式转换为时间格式

4.时间索引

5.时间运算

两个时间之差
时间偏移
timedelta

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值