京东购买预测项目中使用一些函数使用方法记录01

京东购买预测项目中使用一些函数使用方法记录01


最近在练习京东购买预测的项目,把遇到的查过的函数使用方法放出来供大家进行学习。 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

一、 drop_duplicate()、duplicated()区别

这两个函数中,duplicated()主要用在判断函数内是否存在重复值,drop_duplicated()在判断完后去除重复值。

代码如下(示例):

data.drop_duplicate(subset = ['A',‘B’), keep = 'first' , inplace = True )

(1)subset = [‘A’,‘B’], 代表对应的列名,表示只考虑这两列,如果没有subset代表默认所有列。
(2)keep = 'first’表示保留第一次出现的重复行,默认保留第一次出现的值,在keep选项中有last与False,分别表示表示保存最后一个值和删除重复值。
(3)inplace = True,表示直接在原来的DataFrame上删除重复值,inplace = False表示需要指定返回值

# 判断重复值
isDplicated = df.duplicated() # 判断重复数据记录
isDplicated

二、data.to_datetime()

将给定的数据按照指定格式转化为日期格式:
1、

pd.to_datetime('2020-12-29', format = '%Y-%m-%d')

Timestamp(‘2020-12-29 00:00:00’)
2、

pd.to_datetime('29/12/2020', format = '%d/%m/%Y')

Timestamp(‘2020-12-29 00:00:00’)
3、

pd.to_datetime('29/12/2020 10:50:20', format = '%d/%m/%Y %H:%M:%S')

Timestamp(‘2020-12-29 0:04:50’)
4、
在数据出错的时候如下代码,可以使用errors = 'ignore’进行规避

pd.to_datetime('29/12/2020 10#50:20', format = '%d/%m/%Y %H:%M:%S', errors = 'ignore')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值