电子产品销售分析

本文通过对电子产品销售数据的深入分析,揭示了销售趋势、热门产品和消费者行为特征。数据显示,第一季度为销售淡季,第三季度达到销售高峰,广东省、上海、北京消费力显著。热销产品以智能手机为主,三星、苹果和ava品牌表现突出。用户购买分析显示,新用户在8月达到峰值,大部分客户在周一至周二和周末活跃。复购和回购率在8月达到高峰,随后下降。
摘要由CSDN通过智能技术生成

一、背景和目的

通过分析电子产品销售数据,探索产品的具体销售情况,了解产品需求和受欢迎度,实现更加精细精准化运营,使业务更好地增长。

二、数据集简介

数据来源:和鲸社区数据集——电子产品销售分析,本数据包含了有关日期、订单、销售额等信息,一共564169行,12列。

数据字段介绍:

v2-1f057ec6c417213dc6a3babeb8e9da60_720w.png?source=d16d100b

三、分析框架与思路

v2-11d97d9d7cbefa109275a04434e4ade7_720w.png?source=d16d100b

四、数据清洗

(一)导入和读取数据

1、创建并使用数据库

v2-3634f865718556fa43cc74cad5d9d734_720w.png?source=d16d100b

2、导入并读取数据

创建表,名为sales

导入数据文件——电子产品销售分析:

v2-883d973d641e3681d74439591caeb214_720w.png?source=d16d100b

一共564169行,12列。

(二)值处理

1、空值

(1)查找空值

v2-6c2f07a1c3f26776c0b38170e7af94f0_720w.png?source=d16d100b

由于数据量较大,用NULL命令输出的结果不方便浏览,所以用COUNT命令检查各列对应的行数是否相等。

经对比,发现空值在category_code和brand两列。

(2)空值处理

category_code缺失564169-434799=129370行,占比较大,不宜去除,统一用N填充。brand缺失564169-536945=27224行,占比不大,可去除。

2、重复值

考虑到同一个订单可能有多个产品或者同一个产品可能有多个数量,这里不作处理。

3、异常值

v2-c20794166615a62d410d8aadec2193a6_720w.png?source=d16d100b

年龄列无异常值,价格为0的记录输出30行,实际中商家可能在推广活动中有免费赠品,因此不用删除。

4、无用值

Unnamed为行号,属于多余值,需要删除。

(三)修改列

1、删除和新增列

删除未知列,新增日期、年、月、周几、小时列。

v2-00045c3babe3628a3e95b5f13a1e33fb_720w.png?source=d16d100b

2、新列赋值

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值