python 好用的库存尾货女装_利用python对女装电商服装评论数据清洗和分析

最新推荐文章于 2020-12-22 17:07:47 发布

weixin_39844901

最新推荐文章于 2020-12-22 17:07:47 发布

阅读量522

点赞数 2

文章标签： python 好用的库存尾货女装

这篇博客基于Kaggle上的女性服装电商数据集，探讨了评论者年龄分布、购物体验及产品推荐情况。数据显示，平均年龄为43岁的中年女性构成了主要评论群体，平均评分4.1分，大部分给出5分好评，且大多数评论者推荐了产品，表明购物体验良好，推荐意愿强。

摘要由CSDN通过智能技术生成

本次选取了kaggle上女性服装电子商务数据集，围绕客户撰写的评论。它的九个支持功能提供了一个很好的环境，可以通过多个维度解析文本。kaggle链接地址：Women's E-Commerce Clothing Reviews，该数据集包括23486行和10个特征变量。

提出问题

1.参入者的年龄分布情况？

2.参入者的购物体验如何？

3.参入者的推荐情况如何

理解数据

Age，评论者年龄

Rating，评分，从1最差到5最高，

Recommended IND，是否推荐该产品，0不推荐，1推荐

Class Name，服装类型

Clothing ID 服装ID

处理数据读取数据从csv文件获取子集，主要选取了'Clothing ID','Age','Rating','Recommended IND','Class Name'五个列名

结论，可以看出平均年龄为43，最小为18岁，最大为99岁，评论者大多分布于中年女性，评分平均4.1分，大多数为5分，得出购物体验还是比较好，绝大多数都推荐了产品，参入推荐的人还是很多，乐于参入推荐活动。

清洗数据总结

选择子集 df=df.loc[:,['index0','index1','index3']]选取需要的列

列表重命名 namedict={'index0':'a','index1':'b','index3':'c'}

df.rename(columns=namedict,inplace=True)

缺失数据处理查看缺失值 df.isnull().sum() 删除缺失值 df=df.dropna()

数据类型转化 df['a']=df['a'].astype('int')

排序 df=df.sort_values(by='a',ascending=True)

重命名行名 df=df.reset_index(drop=True)

异常值处理通过条件删除异常值 query=df.loc[:,'a']>0 df=df.loc[query,:]

填补缺失值 df.fillna()

weixin_39844901

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python 好用的库存尾货女装_利用python对女装电商服装评论数据清洗和分析

本次选取了kaggle上女性服装电子商务数据集，围绕客户撰写的评论。它的九个支持功能提供了一个很好的环境，可以通过多个维度解析文本。kaggle链接地址：Women's E-Commerce Clothing Reviews，该数据集包括23486行和10个特征变量。提出问题1.参入者的年龄分布情况？2.参入者的购物体验如何？3.参入者的推荐情况如何理解数据Age，评论者年龄Rating，评分，从...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。