pandas学习小记

这篇博客介绍了如何在数据处理中进行三步操作:1) 使用lambda函数结合numpy随机为数据列赋予0到500之间的整数;2) 将日期与天数结合生成完整的日期字符串;3) 根据预设概率分布从给定列表中选择元素赋值给数据列。这些技巧在数据预处理和分析中非常实用。
摘要由CSDN通过智能技术生成

原始数据

1.某列所有元素随机赋值

data['duration_time'] = data['duration_time'].map(lambda x: np.random.randint(0, 500))

2.两列字符串拼接

data_["activity_date"] =[ '2020/1/ % i' % i for i in data_["activity_day"]]

结果:
在这里插入图片描述
3.按一定概率在列表中选取元素赋值于某列

table = ['湖北', '湖南', '福建','海南','广东','上海','北京','江苏','广西','山西','山东','浙江']
data_ks['item_city'] = data_ks['item_city'].map(lambda x: np.random.choice(table,p=[0.1, 0.05,0.05, 0.1, 0.1, 0.1, 0.03, 0.1,0.1,0.1,0.07,0.1]))

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值