数据导入sql为啥会出现多个小数点_SQL分析天猫耐克鞋子价格

用SQL分析天猫耐克鞋子价格

36ad460966619dec0096510b7f1b44d8.png

一、提出问题:

我想知道以下几点:

1、天猫上耐克鞋子交易笔数高的价格大概在什么价位;

2、男女对应的价格是多少;

3、店家最高的交易笔数是多少;

二、理解数据:

1、我用集搜客采集到的数据是以下格式:

073ac4f1be0077626a79a27a5c167ac5.png

基本上框起来的列没什么用,所以就删除了,不导入到数据库里了。

2、因为SQL涉及到一个主键的问题,如果以商品名称为主键,会有重复值,会导致有些重复行导入不到数据库里 ,所以在A列前面增加了一列,=B2&C2&D2&E2&F2

87a843af4ff8a323a7e096ca7609e058.png

然后选中所有数据,删除重复值,这样就从19192行,变成了5123行了。

349bf9ae5bbebb7397e4926ae0e4e49e.png

a934a503d5ceb173d14ae8c2a09efaa7.png

3、经过整理后就剩下“合并信息”、“价格”、“商品名称”、“卖家”、“月成交笔数”、“评价数”,这5列数据。

cac37fa867b5e4c16dfbb94590f70629.png

三、数据清洗:

1、发现数据存在几个问题:

(1)价格列,前面有个金钱符号,要去掉;价格有两位小数点也去掉;而且是文本格式,要转换成数值格式;

(2)月成交笔数,有“笔”字,去掉;

(3)评价数,单位不统一,有的是以“一”为单位,有的是以“万”为单位,而且是文本格式,也要转换成数值格式;

(4)需增加一列,从“商品名称”中提取性别:即商品名称中包含“男”,性别则为“男”,同理商品名称中包含“女”,性别则为”女“,“男女”都没有提到的,则为“中性”;

以上问题,通过EXCEL进行处理,得出以下数据:

ed19caf58e6fcd58d8d486def072b79a.png

2、建表,导入数据:

5dc5b016e3ca39be8e5d8832e458c73c.png

98c7c30d5ccd38e8a443a2b26a02c300.png

设置合并信息为主键。

d054d4927e4e73ded14ab3776872f7b9.png

这样数据就导入到数据库里了。

3、检查下是否所有行都导入了:

9ec1b3dcfeb80097708c9d0fe6a20587.png

5123行扣掉第一行字段行,是有5122行数据没错。

四、数据建模及数据可视化:

1、价格段分析:价格从100多到两万多都有,价格段拟分为:100-500,500-1000,1000-2000,2000-5000,5000-10000,10000-20000,20000以上

b31a33bf90ebf34b13ebd7c6cd8ccfc4.png

2f65dfbac5db70ae58a9139e33ea23d9.png

由上可见,100-500价格段的购买人数比较多,其次是500-1000,再次是1000-2000,超过5000的基本就很少人买了。分类的价格段与成交比数成反比。价格段约低,成交笔数约高,价格段约高,成交笔数约低。

2、卖家分析:

(1)天猫上有多少卖家在卖耐克的鞋子:

ddff584be23fb66a39debdeb7b253e7b.png

天猫上有93家卖家在卖耐克的鞋子。

(2)月有产生销售的卖家有几家:

30058f23ac84eaae10d39f49b4c899db.png

93家卖家中,月有产生销售的有92家,只有一家没有产生销售。

(3)月成交笔数前15的卖家是哪几家,销售第一是谁?

7bbc2cd50354cc5cd8e2cc78c1e4ec68.png

1d2e7b06dc8e4dddb7671977b68eef60.png

由上可见,销售第一的店铺是“NIKE官方旗舰店”,月成交笔数534246,且遥遥领先第二名“速捷运动专营店”的月成交笔数18937,可见大家对官方旗舰店还是比较信赖的。

3、性别分析:

男、女、中性性别中,月成交笔数各是多少,占比多少。

97a9062f0ad1022a5336e9e638641cb1.png

由上可见,男鞋卖得比女鞋好,男鞋占比达74%,女鞋只有25%,中性(没有表明男女)的只占了1%。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值