通过Kmeans聚类算法分析行业价格给商品定价

最新推荐文章于 2024-03-02 01:15:05 发布

忘回

最新推荐文章于 2024-03-02 01:15:05 发布

阅读量4.6k

点赞数 7

分类专栏：从0~N，电商数据分析文章标签：数据分析数据建模 python 聚类算法电子商务

本文链接：https://blog.csdn.net/qq_40195798/article/details/112625052

版权

本文通过KMeans聚类算法分析淘宝“粉饼”类目商品价格，探讨如何利用数据进行商品定价。数据来源是销量TOP400商品，发现适合分为3类，价格区间分别对应不同销量中心，为电商商品定价提供参考。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

前言

电商中的数据维度有很多，各方各面都会有数据存在，通过对这些数据进行分析，我们就可以知道一些我们需要的信息。商品的定价对于电商销售来说有着关键的影响。比如定价多少会直接影响所获得的利益。定价太低也许销量有了却没有利润，定价太高有利润可惜卖不出去。只有合适的价格，才能获得市场中的一席之地。

本篇以彩妆行业下三级类目“粉饼”类目为例，数据来源是淘宝搜索“粉饼”关键词下，60%价格段销量排序的TOP400个商品。

一、聚类算法——Kmeans

Kmeans聚类算法，又叫K均值聚类算法。是一种迭代求解的聚类分析算法。预先将数据分成K组，随机选定K各对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离。把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有（或最小数目）对象被重新分配给不同的聚类，没有（或最小数目）聚类中心再发生变化，误差平方和局部最小。
Kmeans算法是数据分析中常用或者说常见的算法，属于聚类算法之一，用于对不知道明确划分界限的数据分类。电商中通常用在客户分析，构建RFM模型。

二、使用步骤

1.引入库

代码如下（示例）：

import numpy as np
import pandas as pd 
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.externals import joblib
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import MinMaxScaler

2.读入数据

代码如下：

data1= pd.read_csv(r'F:\灯具彩妆执行\彩妆\行业分析报告\数据\价格\粉饼.csv',encoding='utf-8')

3.数据检查及处理

data1.dtypes
data1["销售价最低"]=data1["销售价最低"].astype(np.int64)
data1["30天销售额"]=data1["30天销售额"].astype(np.int64)

在这里插入图片描述

查看数据类型，可得知我们的数据源中各个字段的数据类型，和共有多少个字段。将之后会用到的字段修改成方便数据处理的类型。

data1.info()

在这里插入图片描述
info函数同样可以做到这一点，不仅如此，info()还可以让我们知道这些字段中，哪些字段数据有缺失，从而让我们可以将这些数据进行处理（删减/填充）。

dt2 = data1

最低0.47元/天解锁文章