数据科学包3-pandas快速入门2

本文在IPython Notebook环境下介绍了pandas的使用,包括处理缺失数据、数据运算、数据合并、分组统计、数据整形、数据透视、时间序列、类别数据处理和数据可视化。还讲解了如何导入导出CSV、HDF5和Excel文件,以及各种操作如删除空数据、计算平均值、应用函数、直方图和字符串处理。
摘要由CSDN通过智能技术生成

一、在 ipython notebook 环境下 pandas的快速入门

1.打开ipython notebook 操作

1.在windows命令窗口下输入

C:\Users\admin>ipython notebook
# 自动跳转到  http://localhost:8888/tree   连按两次ctrl+c即可关闭

2.点击如下
在这里插入图片描述
在这里插入图片描述

2.处理丢失数据

1) 构造出二维的DataFrame ,其中包含一些空数据

在这里插入图片描述
在这里插入图片描述

2) 删除任何缺少数据的行-返回复制的

在这里插入图片描述

3) 填充丢失的数据–返回复制的

在这里插入图片描述

4) 判断一个数据集里面是否包含有空数据

在这里插入图片描述
数据很多时
在这里插入图片描述

3.数据运算

1)空数据不参与运算

2)平均值

在这里插入图片描述

3)累加值

在这里插入图片描述

4)广播及shift函数

对具有不同尺寸且需要对齐的对象进行操,pandas会自动沿指定尺寸广播

shift函数是对数据进行移动操作

函数原型为:DataFrame.shift(preiods=1,freq=None,axis=
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值