数据分析实战:某电商电子产品销售数据分析

1. 项目背景

通过分析销售数据来了解在线销售业务的消费情况,分析用户消费数据来分析用户的消费行为,为用户推荐相匹配的商品。

2. 数据概况

2.1. 加载数据

data = pd.read_csv("./data/某电商电子产品销售数据分析.csv")
data.head()

2.2. 数据说明

列名 类型
下单时间 datatime
订单编号 str
产品编号 str
类别编号 str
类别 str
品牌 str
价格 float65
用户编号 str
年龄 int64
性别 str
省份 str

3. 数据清洗与整理

3.1. 数据类型转换

data['下单时间'] =  pd.to_datetime(data['下单时间'])
data[['订单编号','产品编号','类别编号','用户编号']] = data[['订单编号','产品编号','类别编号','用户编号']].astype(str)
data['年龄'] = data['年龄'].astype(int)

3.2. 空值和重复值

数据集中有空值,无重复值

# 类别为空的数据,使用类别编码填充
data['类别'] = data['类别'].fillna(data['类别编号'])
# 品牌为空的数据,填充 unknoun
data['品牌'] = data['品牌'].fillna('unknown')

3.3. 删除无用列

# 第一二列是无用列
data.drop(data.columns[[0,1]], axis=1, inplace=True)

3.4. 新增列

data['month'] = data['下单时间'].dt.month
data['hour'] = data['下单时间'].dt.hour
data['weekday'] = data['下单时间'].dt.weekday
data['weekend'] = ((data['weekday'] == 5) | (data['weekday'] == 6)).astype(int)

4. 探索性分析

4.1. 销售情况

4.1.1. 月度

经分析,数据集中包含1307条 1970 年数据,其他为2022年数据(占比99.66%)

for year in data['下单时间'].dt.
### Python 电商数据分析项目示例 #### 数据获取与准备 为了进行有效的电商数据分析,通常会先收集电商平台上的商品信息。这可以通过网页抓取来完成[^2]。一旦获得了原始数据,就需要利用 `Pandas` 库来进行清洗和整理工作。 ```python import pandas as pd # 假设我们有一个CSV文件包含了电商交易记录 data = pd.read_csv('ecommerce_data.csv') # 查看前几行的数据结构 print(data.head()) ``` #### 销售额统计分析 接着,可以计算各产品的总销售额,并对其进行排序以便找出最畅销的产品[^3]: ```python # 计算每种产品的总销量(价格乘以数量) product_sales = data.groupby('product_name').agg({'price': sum, 'quantity': sum}) product_sales['total_sales'] = product_sales['price'] * product_sales['quantity'] # 对产品按销售额降序排列 product_sales_sorted = product_sales.sort_values(by='total_sales', ascending=False) # 显示排名前十的商品及其销售额 top_products = product_sales_sorted[['total_sales']].head(10) print(top_products) ``` #### 可视化展示结果 最后一步是将上述分析的结果可视化出来,这里采用的是 `Matplotlib` 来绘制柱状图表示不同产品的销售业绩[^1]: ```python import matplotlib.pyplot as plt plt.figure(figsize=(10, 6)) plt.barh(y=top_products.index, width=top_products.total_sales.values) plt.title('Top Selling Products') plt.xlabel('Total Sales (Price * Quantity)') plt.ylabel('Product Name') plt.tight_layout() plt.show() ``` 此过程不仅展示了如何运用Python中的多个流行库执行完整的电子商务数据分析流程——从数据采集到最终呈现;同时也强调了在实践中灵活应用各种技术和方法的重要性。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值