电商数据清洗

通过相关渠道,搜集得到2013年某网购平台的全年数据,现将对其进行清洗,为下一步建模与分析做准备。

导入模块,展示数据

import pandas as pd
import numpy as np
data = pd.read_csv(r'C:\Users\admin\Desktop\文件汇总\电商数据分析\abnormal_orders.txt')
data.head()
data.shape  #查看样本数、特征数
#(134190, 14)
data.columns = ['订单id','下单日期','下单时间','商品一级类别','商品所属渠道','商品id','品牌','订单金额','商品销售数量','订单渠道','支付方式','下单用户id','城市','异常']
#更换列名为中文

标签搜索

(data['异常'] == 1).sum()
#28457
(data['异常'] == 1).sum()/data.shape[0]
#0.2120649824875177

可看出:样本存在不均衡,但程度较轻

下单时间

data['下单日期'].value_counts()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值