Pandas使用教程(六)

一、在数据集中随机取数

ufo.sample()
在这里插入图片描述
利用此方法可以划分训练集和测试集。比如随机取75%的数据作为训练集,剩下的25%作为测试集:
在这里插入图片描述

二、How to create dummy variables in pandas?

method1:
在这里插入图片描述
method2(更简洁):
在这里插入图片描述
在这里插入图片描述
将dummy columns加入到原来的DataFrame:pd.concat()
在这里插入图片描述
bonus:最简洁的写法!
在这里插入图片描述
在这里插入图片描述

三、How to work with dates and times in pandas?

example1:
在这里插入图片描述
example2:
在这里插入图片描述
转换成日期类型的好处:更方便的处理日期,比如:

ufo.Time.dt.weekday_name
ufo.Time.dt.weekday
ufo.Time.dt.dayofyear

example3:时间戳
在这里插入图片描述
example4:数学操作
在这里插入图片描述
bonus:统计每年ufo报道的次数并绘图(可视化)
在这里插入图片描述

四、How to find and remove duplicate rows in pandas?

在这里插入图片描述
keep=False:查看所有重复的rows
在这里插入图片描述
删除重复:drop_duplicates()
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值