python数据处理:pandas相关应用(二)

摘要:日常工作和学习中通常需要将手中的csv数据进行读取、清洗、预处理然后导出。Pandas作为强大的结构化数据分析工具集,它的使用基础是Numpy,用于数据挖掘和数据分析,同时也提供数据清洗功能。本文视角从excel数据处理进行类比讲述。

pandas官方文档

Dataframe 相关应用

1.数据筛选、插入基本功能

tips = pd.read_csv(url)#读csv文件

对于pandas,通过将列名列表传递给DataFrame来完成列选择:

tips[['total_bill', 'tip', 'smoker', 'time']].head(5)

对于pandas,可以使用DataFrame.assign()DataFrame 的方法追加新列:

tips.assign(tip_rate=tips['tip'] / tips['total_bill']).head(5)代码片

DataFrame可以通过多种方式进行过滤。最直观的方法是使用 布尔索引。

tips[tips['time'] == 'Dinner'].head(5)

多个条件,与&;或|

tips[(tips['time'] == 'Dinner') & (tips['tip'] > 5.00)]

NULL检查是使用notna()和isna() 方法完成的。


                
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值