数据分析--部分操作

1、将某一列作为索引
data =data.set_index('key')
2、数据分割(提取日期中的月份)
x='2017/1/1 9:05'
print(x.split('/')[1])
print(x.split('/')[2])
print(x.split('/')[2].split(' '))  ##x.split('/'):按‘/’进行分割

在这里插入图片描述

import pandas as pd
time = ['2017/1/1','2017/1/2','2017/1/3']
data = pd.DataFrame(time,columns=['time'])
f = lambda x: int(x.split('/')[1])
data['mounth'] = data['time'].map(f) 

在这里插入图片描述

3、根据某一列的数值将另外一个表中对应的值添加在新一列
data = pd.read_csv('.\附件1.csv',encoding='gbk')

在这里插入图片描述

df = pd.read_csv('.\附件2.csv',encoding='gbk')

在这里插入图片描述

df = dict(zip(df['商品'], df['大类'])) 
#zip()可以将两个或多个列表压缩成一个列表的,  dict构建字典
#get方法用来获取一个对象中指定元素
f = lambda x: df.get(x,x)
data['大类'] = data['商品'].map(f)

f = lambda x: int(x.split('/')[1])
data['mounth'] = data['支付时间'].map(f) 
data.head()

在这里插入图片描述

4、nlargest
pd.nlargest(n, columns) 

返回按列降序排列的前n行。

以降序返回column中具有最大值的前n行。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值