京东购买预测项目中使用一些函数使用方法记录01

最新推荐文章于 2023-05-20 00:04:38 发布

GuoShuaihao

最新推荐文章于 2023-05-20 00:04:38 发布

阅读量199

点赞数 1

文章标签： python pandas 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ggxiabai/article/details/111877947

版权

京东购买预测项目中使用一些函数使用方法记录01

最近在练习京东购买预测的项目，把遇到的查过的函数使用方法放出来供大家进行学习。提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

一、 drop_duplicate()、duplicated()区别

这两个函数中，duplicated()主要用在判断函数内是否存在重复值，drop_duplicated()在判断完后去除重复值。

代码如下（示例）：

data.drop_duplicate(subset = ['A',‘B’), keep = 'first' , inplace = True )

（1）subset = [‘A’,‘B’], 代表对应的列名，表示只考虑这两列，如果没有subset代表默认所有列。
（2）keep = 'first’表示保留第一次出现的重复行，默认保留第一次出现的值，在keep选项中有last与False，分别表示表示保存最后一个值和删除重复值。
（3）inplace = True,表示直接在原来的DataFrame上删除重复值，inplace = False表示需要指定返回值

# 判断重复值
isDplicated = df.duplicated() # 判断重复数据记录
isDplicated

二、data.to_datetime()

将给定的数据按照指定格式转化为日期格式：
1、

pd.to_datetime('2020-12-29', format = '%Y-%m-%d')

Timestamp(‘2020-12-29 00:00:00’)
2、

pd.to_datetime('29/12/2020', format = '%d/%m/%Y')

Timestamp(‘2020-12-29 00:00:00’)
3、

pd.to_datetime('29/12/2020 10:50:20', format = '%d/%m/%Y %H:%M:%S')

Timestamp(‘2020-12-29 0:04:50’)
4、
在数据出错的时候如下代码，可以使用errors = 'ignore’进行规避

pd.to_datetime('29/12/2020 10#50:20', format = '%d/%m/%Y %H:%M:%S', errors = 'ignore')

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。