网上最全【AI定价】万字长文！人人都能看懂！附代码！

最新推荐文章于 2025-04-02 16:42:41 发布

运筹匠心

最新推荐文章于 2025-04-02 16:42:41 发布

阅读量1.8k

点赞数 19

分类专栏：促销定价文章标签：人工智能算法数学建模机器学习 python

本文链接：https://blog.csdn.net/IndustryOR/article/details/137480505

版权

促销定价专栏收录该内容

6 篇文章

订阅专栏

导读：本文系统介绍了如何将一个实际的促销定问题转化为一个数学问题，并利用数据预处理与挖掘、统计学与机器学习、运筹优化等技术从 0-1 的解决该问题。帮助大家深入了解AI技术是如何在【促销定价】场景落地的。本文将包含完整的业务+数据+算法+代码。

作者 1：张哲铭，算法专家，某互联网大厂
作者 2：向杜兵，算法专家，某制造业龙头

大家好！我们是IndustryOR 团队，致力于分享业界落地的OR+AI技术。欢迎关注微信公众号/知乎【运筹匠心】 。本期我们将选择某零售商超“促销定价”场景，来谈一谈AI技术是如何在【促销定价】场景落地的。

数据+代码

由于篇幅原因，数据和代码（超详细注释）附在粉丝群公告，大家可自行加群获取，加群方式在文章末尾~~

在日常生活中，我们经常会遇见线上/线下商家推出各类打折、满减、赠品、新人价、优惠券、捆绑销售等促销活动。一次成功的促销对于消费者和商家来说是双赢的。一方面，促销活动能让消费者买到低价的商品；另一方面，促销活动也能为商家带来可观的利润。

尽管促销活动五花八门、玩法多变，但其底层的核心商业逻辑是“价格”。因此，对于商家来说，如何科学合理地进行促销定价是重中之重。

本文将从以下4个部分讲解：

01 业务拆解
02 数据挖掘
03 价格弹性
04 定价决策

文章有些长，但全是干货，建议横屏观看，看完一定收获满满。坐好板凳，我们正式起航~~~

01 业务拆解

1.1 业务背景

在新冠疫情、俄乌战争、巴以战争、大国博弈等时代大背景下，全球经济目前正处于下行周期，消费降级趋势已经形成，各行各业都在积极转型变革，以应对时代的挑战，寻找新的增长点。

以零售行业为例，过去几年涌现了不少新业态。如：线上渠道，直播带货、内容电商、社区团购等模式高速发展；线下渠道，折扣店、临期食品店、工厂店等门店遍地开花。不难发现，为了顺应消费降级的大趋势，“低价促销”已逐步成为现阶段零售行业的共识和最重要的竞争要素。

1.2 关键挑战

“低价促销”是一种可以让消费者和商家同时受益的经营手段，消费者用“低价”买到了心仪的商品，商家通过“促销”实现了利润的增长。但实现双赢的前提是要保证“促销定价”的合理性，即对每个商品均制定出最合适的价格。否则，就变成了“高价降销”或者“赔本赚吆喝”。那么，商家在“促销定价”时会遇到哪些挑战呢？

抛开活动策划、促销手段、促销时间、促销时长、促销渠道、推广方式、引流策略、售后支持等业务动作不谈。我们单从“定价”的角度上看，挑战可归纳为以下4点：

不清楚选哪些商品进行促销？ 选高销品利润薄可能亏本；选积压品可能不受欢迎卖不出去。
不清楚促销商品定什么价格？ 价格定低可能会亏本；价格定高可能会滞销。
**不清楚定价后商品销量会如何变化？**有些商品降价后，销量可能会大增；有些商品涨价后，销量可能不变。
不清楚促销能带来多大的利润？ 销量大增，利润可能减少；销量减少，利润可能增加。

1.3 问题拆解

站在业务的角度上考虑，商家的核心诉求可总结为一句话：在“促销”中，如何“定价”才能保证合理的利润？

要想回答这个问题，就必须知道价格和利润的关系，即定什么价格能得到什么利润。我们都知道：

商品利润 =（商品售价 - 商品成本价） $\times$ 商品销量 。

注意：这里的利润指商品毛利，未考虑仓储/运营/税收等成本。

观察上述公式，商品利润是最终的结果，商品售价是待“定价”的变量，商品成本价是已知的常量，商品销量是一个未知的变量。因此，

我们只要知道商品销量的取值，就可以知道定什么价格下能得到什么利润了。

那么，商品销量这个变量该如何被量化呢？ 我们都知道商品价格是影响商品销量的重要因素。从整体上看，商品的价格和商品的销量大概率呈现负相关，即价格越高，销量越低。但这并不意味着这种相关性在商品的某个局部价格区间下同样成立。

举个例子说明：泰国猫山王榴莲的是一种比较昂贵的进口水果，市场价大概90-110元/斤。如果商家打折出售1元/斤，肯定1秒就会被抢光；如果商家定价9999元/斤，估计大概率无人购买，当然土豪除外。但这一现象一定能推测出商家定价95元时肯定会比定价105元时销量高吗？显然不一定。也许这两种价格下的销量并没有太大的差别，因为能消费的起泰国猫山王榴莲的客户对10元以内价格波动的感知是微弱的。但如果10元的价格波动发生在鸡蛋上，销量可能会天差地别。

由此，我们可以得出一个重要的结论：

对于不同的商品来说，在一定的价格区间内，相同幅度的价格波动所带来的销量波动的幅度可能是不同的。

这也就意味着，我们如果能找到每种商品的合适的价格区间，并量化出区间内价格与销量的关系，就能预估出每种商品的在不同价格下的大致销量，进而估算出大致的利润，这种定价方式叫做精细化定价。通过这种方式，我们可以精细化地制定出每种商品合适的价格，在保证消费者享受部分商品折扣的同时，实现商家利润的合理最大化。（还有一种更精细化的定价方式叫做差异化定价，侧重于考虑到不同客户群体的消费偏好和消费能力，大家有兴趣可以了解一下。）

接下来，我们用简单的数学语言描述一下该问题：
$\max \sum_{s \in S} (p_{s}-c_{s})\times q_{s} \space\space\space (1)$
$q_{s}=f(p_{s},\theta_{s}) \space\space\space \forall s \in S \space\space\space (2)$
$l_{s} \leq p_{s} \leq h_{s} \space\space\space \forall s \in S \space\space\space (3)$

上述公式中， $S$ 表示商家售卖商品集合； $c_{s}$ 表示商品 $s$ 的成本价； $p_{s}$ 表示商品 $s$ 的售价； $q_{s}$ 表示商品 $s$ 的销量； $f(p_{s},\theta_{s})$ 表示商品 $s$ 销量与商品售价之间的量化函数； $l_{s}$ 和 $h_{s}$ 分别商品合适的价格区间的左右边界价格。式 $(1)$ 表示商家利润最大化，即所有种类商品利润加和最大化；式 $(2)$ 表示每种商品的销量与售价之间的关系；式 $(3)$ 表示每种商品的价格均要在合适的区间。

1.4 小结

经过以上拆解，我们明确促销定价的3个主要任务：

量化出商品价格与销量的关系。即确定 $f(p_{s},\theta_{s})$ 的具体形式。
找到每种商品合适的价格区间。即确定 $l_{s}$ 和 $h_{s}$ 的取值。
选择出能使总利润最大化的不同商品的最佳价格。即求解出能使 $\sum_{s \in S} (p_{s}-c_{s})\times q_{s}$ 最大化的 $p_{s}$ 。

02 数据挖掘

2.1 数据概览

本案例本案例数据改编自【2019年全国大学生数学建模E题】公开数据集。主要用到销售流水表1/2（附件1/2）和商品信息表（附件4），表结构如下：

销售流水表

字段	含义
order_id	订单ID
is_finished	订单是否完成
sku_id	商品ID
sku_name	商品名称
sku_prc	门店价
sku_sale_prc	销售价
sku_cost_prc	成本价
sku_cnt	销售数量
upc_code	UPC码
create_dt	创建时间

商品信息表

字段	含义
skuid	sku名称
skuname	sku名称
first_category_id	一级类目id
second_category_id	二级类目id
third_category_id	三级类目id
first_category_name	一级类目名称
second_category_name	二级类目名称
third_category_name	三级类目名称

order_detail_df1
sku_detail_df
我们发现：

销售流水表upc_code字段部分缺失，其他字段不缺失。商品信息表无缺失字段。 。

2.2 数据加工

原始数据需要经过清洗、聚合、补全等操作，加工成便于分析求解的数据。

详见代码(文末加粉丝群获取~~~)

最终待分析求解的促销定价数据大宽表（promotional_pricing_data1.csv）结构如下：

促销定价数据大宽表

字段	含义
sku_id	商品ID
sku_name	商品名称
ori_prc	原价
sale_prc	售价
cost_prc	成本价
sku_cnt	销量
cate1_id	一级类目id
cate2_id	二级类目id
cate3_id	三级类目id
cate1_name	一级类目名称
cate2_name	二级类目名称
cate3_name	三级类目名称
sale_dt	销售日期

类别型特征
数值型特征

我们发现：

加工后的数据集共有1105365条样本，无空值。
数据共有3187种sku，1级品类26种、2级品类156种、3级品类565种。75%的商品售价不高于18.8、日销量不超过4个，但也有超过千元的高价品和销量过千的高销品。

2.3 数据分析

2.3.1 聚合分析

为了进一步挖掘数据，我们分别在天维度、品维度、价格维度和数量维度对数据进行聚合分析。

1）天维度

统计每日的销量、GMV(销售额)、成本、毛利额、折扣率等信息，画出趋势图。

我们发现：

GMV、利润额与销量呈强正相关，销量越高，GMV、利润额越高。
利润率与销量、利润额相关性不明显，有时利润率很低，但利润额很高；有时相反。这说明“降价促销”是存在赚钱的可能性的。
折扣率与销量呈正相关，趋势相同，但并不是折扣率越高一定是销量越高，如：商家在5.4后大幅调低整体折扣，但销量不降反升。这说明精细化定价是可行的，在合理的折扣区间制定高销的价格，增加GMV和利润。

2）品维度

统计各级品类/sku下子品类宽度（子品类个数）、sku宽度（个数）、sku总销量、sku价格等信息，画出分布图。

我们发现：

不同品类下的子品类和sku数量差异较大。以3级品类下sku数为例：最少1个，最多63个，中位值3个；
不同sku的价格带不同。以售价均值为例：最小0.8元，最大1100元，中位值13.80元。这说明定价时每个sku的价格区间需要精细化制定。

3）价格维度

统计不同价格区间下sku宽度、总销量、总gmv、总成本、总毛利，画出分布图。

我们发现：

绝大部分sku的价格分布在20元以下，5-10元区间的sku占比最多。

4）数量维度

分别统计不同历史售卖天数和不同历史价格数下的sku宽度分布，画出分布图。

我们发现：

不同sku的历史价格数量不同，绝大部分的sku历史价格数量只有1个。针对该现象需要进一步分析，有2种可能：

这部分商品为低价格弹性商品，即价格改变不会引起销量的变化；
这部分商品是高价格弹性商品，但商家未进行太多的促销价格尝试，这会导致这部分商品精细化定价时样本不足，需要思考如何解决该问题。

2.3.2 相关分析

针对1级品类/2级品类/3级品类/sku，分别计算售价/折扣比例/折扣额与日销量间的pearson相关性系数，画出分布图。

1）1级品类

2）2级品类

3）3级品类

4）sku

我们发现：

不同品类/sku的售价/折扣比例/折扣额与日销量间相关性差异极大。如：

对于可口可乐、散装东北大米等长保质期商品来说，售价越低/折扣比例越大/折扣额越大，销量越高。可能是因为该类商品可以囤货。
对于进口香蕉、土鸡蛋等生鲜品来说，售价越低/折扣比例越大/折扣额越大，销量越高。可能是因为该类商品日常消耗较快。
对于红枣风味酸牛奶等短保质期商品来说，售价越低，销量越高；折扣比例/折扣额和销量呈负相关，但相关性不大。可能是因为该类商品一旦打折就意味着临近保质期，大家不愿意购买。
对于伊利高钙奶等高品质商品来说，则售价越高，销量越高，但相关性不大。可能是因为该类商品价格越高品质越佳。

因此，在促销定价时，需要根据不同的sku制定不同的定价策略。

2.3.4 聚类分析

根据2.3.3节计算出来的3级品类平均售价/折扣比例/折扣额与日销量间的相关性系数，对3级品类进行聚类，画出聚类图。

经过实验我们发现，聚4类即可将样本较好的分开，聚类结果也符合业务常识。详情如下：

label=0分类的3级品类，平均售价与日销量弱负相关，折扣比例/折扣额与日销量弱正相关，多为保质期较长，购物频次一般的品类，如：‘一次性内裤’, ‘丸类’, ‘乌龙茶饮品’, ‘冰冻贝类’, '冰淇淋’等。
label=1分类的3级品类，平均售价与日销量强负相关，折扣比例/折扣额与日销量强正相关，多为保质期较短，购物频次较高的品类，如：‘中式点心’, ‘低温加味牛奶’, ‘可乐’, ‘叶菜类蔬菜’, ‘吐司类’, ‘国产季节性水果’, ‘国产梨类’ '婴儿卫生用品’等。
label=2分类的3级品类，平均售价与日销量强负相关，折扣比例/折扣额与日销量强不相关，多为购物频次一般，但平时很少有折扣促销的品类，如：‘其他冲饮粉’, ‘其他肉干’, ‘其他进口洋酒’, ‘名酒’, '味精’等。
label=3分类的3级品类，平均售价/折扣比例/折扣额与日销量强均不相关，多为购物频次较低，平时也很少有折扣促销的品类，如：‘LED灯泡’, ‘一口酥/酥饼’, ‘一次性卫生筷’, ‘一次性塑料口杯’, ‘一次性手套’, ‘一次性纸口杯’, '一次性纸碗’等。

2.4 小结

综上诉说，我们利用数据挖掘技术，从各个维度较为全面的分析了数据的全貌，并深度挖掘了价格/折扣和销量之间的关系。最终，我们得到了一个核心结论：

不同的sku的价格/折扣与销量之间的关系不同，促销定价做的越精细，效果越好。而精细化正是算法相较人工的优势所在。

03 价格弹性

3.1 问题聚焦

经过【01 业务拆解】小结可知，促销定价需要解决的第一个问题是：

量化出商品价格与销量的关系，即确定 $f(p_{s},\theta_{s})$ 的具体形式；

经过【02 数据挖掘】小结可知：

不同sku的价格与销量之间的关系不同，促销定价做的越精细，效果越好。

因此，接下来我们需要解决的问题是：

如何精细化地确定价格与销量的关系模型 $f$ 的形式和模型参数 $\theta_{s}$ 的取值？

针对以上问题，目前业界落地方案可分为3大类：

类别	方法	优劣势
白盒方案	价格弹性模型	可解释性强，量化效果一般
黑盒方案	机器/深度学习模型	量化效果好，可解释性弱
融合方案	机器/深度学习模型+因果推断	量化效果较好，可解释性较强

白盒方案：可表示为 $Q=E(P,\Theta)$ ，一般采用价格弹性模型， $E$ ， $P$ 为待定价格， $Q$ 为定价 $P$ 下产生的销量， $\Theta$ 为学习参数。此类模型通常可解释性强，但销量 $Q$ 量化效果一般。
黑盒方案：可表示为 $Q=F(X,P,\Theta)$ ，一般采用机器/深度学习模型，除待定价格 $P$ 外，还可以引入其他的特征 $X$ 量化销量 $Q$ 。因此，此类模型量化效果好，但可解释性弱。
融合方案：可表示为 $Q=Q_{base}+\Delta Q$ ，通常利用机器/深度学习模型预测基准价 $P_{base}$ 下的销量 $Q_{base}$ ，采用因果推断技术无偏估计出定价 $P$ 与基准价 $P_{base}$ 间的销量波动 $\Delta Q$ ，如利用价格弹性计算： $\Delta Q=E(P,\Theta)-E(P_{base},\Theta)$ ，最终将 $Q_{base}$ 与 $\Delta Q$ 相加得到最终的销量 $Q$ 。该方法既保证了量化效果，又兼顾可解释性，通常被称作“半参数模型”。

一般情况下，业界应用会先选择白盒方案的价格弹性模型作为baseline版本，然后逐步向因果推断方案过渡。因此，本文将重点介绍价格弹性模型是如何量化sku的价格与销量之间的关系的。

3.2 理论介绍

1）价格弹性定义

价格弹性（price elasticity）是经济学领域的重要概念，可分为需求价格弹性、供给的价格弹性、交叉价格弹性、预期价格弹性等各种类型。由于我们本文主要研究价格与销量之间的关系，因为我们接下来将重点研究需求价格弹性。

需求价格弹性（以下简称“价格弹性”）可定义为需求（销量）变动比率与引起其变动的价格变动比率的比率，反映商品价格与市场消费容量的关系，表明价格升降时需求量的增减程度。

用数学公式可表示为：
$(\Delta Q / Q)/(\Delta P / P) \space\space\space (1)$

公式(1)中， $e$ 代表价格弹性； $Q$ 表示销量， $\Delta Q$ 表示销量的变化量，因此 $\Delta Q / Q$ 则表示销量变动比率； $P$ 表示价格， $\Delta P$ 表示价格的变化量，因此 $\Delta P / P$ 则表示价格变动比率。

通过观察以上公式，我们可用通俗的语言描述价格弹性：

价格弹性表示：价格 $P$ 每增加（减少）1%所能带来的销量 $Q$ 增加（减少）的比例。

2） $l n P$ - $l n Q$ 线性回归

我们已经知道了价格弹性的定义，但是如何求解价格弹性呢？答案就是： $l n P$ - $l n Q$ 线性回归。接下来我们逐步推导证明。

首先回顾一下导数的定义：
$\lim_{\Delta x->0}(\Delta y / \Delta x ) \space\space\space (1)$

$l n P$ - $l n Q$ 线性回归可表示为：
$\space\space\space (2)$

等式两边求导可得：
$\space\space\space (3)$

当 $\Delta P$ 较小时，可近似写为：
$(\Delta Q / \Delta P) = e * (1 / P) \space\space\space (4)$

等号两侧交换并整理可得：
$\Delta Q /(\Delta P* Q) \space\space\space (5)$

将 $P$ 移至等式右侧可得：
$(\Delta Q / Q)/(\Delta P / P) \space\space\space (6)$

而式(6)正是价格弹性的定义。

至此，我们可以看出：

$l n P$ - $l n Q$ 的线性回归的回归参数 $e$ 就是我们想求解的价格弹性。

注：除了 $l n P$ - $l n Q$ 线性回归，价格弹性模型还有多种其他的实现形式，大家如果有兴趣可以深入研究。

3）弹性回归

我们选择岭回归（Ridge Regression，L2正则化的线性回归），从聚类簇、3级品类、sku三个维度，分别回归了各自的价格弹性，量化出价格和销量的关系，并选择 $W M A PE$ （Weighted Mean Absolute Percentage Error）评价回归效果。

详见代码(文末加粉丝群获取~~~)

$W M A PE$ 是指带权重的平均绝对百分比误差，是用来做销量预测最常用的指标，越小越好。公式如下：
$WMAPE=\sum_{n} |y^{'} - y| / \sum_{n} y \space\space\space (7)$
分别计算聚类簇维度、3级品类维度和sku维度的 $W M A PE$ 值。

价格弹性回归结果为：

评价结果如下：

分组维度	$W M A PE$
聚类簇	0.7379
3级品类	0.6772
sku	0.6198

我们发现：

对于 $W M A PE$ 值，聚类簇维度 < 3级品类维度 < sku维度，这也验证了【02 数据挖掘】的结论：不同sku的价格与销量之间的关系不同，促销定价做的越精细，效果越好。

04 定价决策

4.1 问题聚焦

经过【01 业务拆解】小结可知，促销定价需要解决的第二、三个问题是：

找到商品合适的价格区间，即确定 $l_{s}$ 和 $h_{s}$ 的取值。
选择出能使总利润最大化的不同商品的最佳价格，即求解出能使 $\sum_{s \in S} (p_{s}-c_{s})\times q_{s}$ 最大化的 $p_{s}$

经过【03 价格弹性】计算：

我们成功地量化出了商品价格与销量的关系。

因此，接下来我们需要解决的问题是：

如何找到商品合适的价格区间，确定 $l_{s}$ 和 $h_{s}$ 的取值
如何选择出能使总利润最大化的不同商品的最佳价格，求解出能使 $\sum_{s \in S} (p_{s}-c_{s})\times q_{s}$ 最大化的 $p_{s}$ 。

这显然是一个运筹决策问题。

4.2 数学建模

4.2.1 $l_{s}$ 和 $h_{s}$ 的确定

$l_{s}$ 和 $h_{s}$ 的取值可以根据历史数据统计得出，我们这里通过取商品原价、售价和成本价的历史最小最大值得到。即：
$l_{s} = \min(...,o_{st},p_{st},c_{st},... ) \space\space\space (1)$
$h_{s} = \max(...,o_{st},p_{st},c_{st},... ) \space\space\space (2)$
上式中， $t$ 表示历史第 $t$ 天， $o_{st}/p_{st}/c_{st}$ 分别表示商品 $s$ 历史第 $t$ 天的原价、售价、成本价。

4.2.2 模型选择

促销定价的决策模型通常有两类建模方式，分别为带有指数二次项的凸优化模型和 0-1 整数规划模型。

1）方案一：凸优化模型

经过【03 价格弹性】可知：
$(\Delta Q / Q)/(\Delta P / P) \space\space\space (3)$
$\space\space\space (4)$
则销量 $Q$ 可表示为：
$\space\space\space (5)$
我们为变量加上下标，可表示为：
$q_{s} = exp(e_{s} * lnp_{s} + b_{s}) \space\space\space (6)$
式(6)表示商品 $s$ 的价格 $p_{s}$ 和销量 $q_{s}$ 之间的关系， $e_{s}$ 表示价格弹性， $b_{s}$ 表示回归偏置项。

将式(6)代入【01 业务拆解】模型可得：
$\max \sum_{s \in S} (p_{s}-c_{s})\times exp(e_{s} * lnp_{s} + b_{s}) \space\space\space (7)$
$l_{s} \leq p_{s} \leq h_{s} \space\space\space \forall s \in S \space\space\space (3)$

其中， $p_{s}$ 为连续型决策变量，其余项均为已知常量；式(7)表示我们决策的目标函数，即利润最大化。可以发现，上述模型是一个含有指数二次项 $p_{s}\times exp(e_{s} * lnp_{s} + b_{s})$ 的凸优化问题，模型比较简单，可直接求得解析解。

2）方案二：0-1 整数规划模型

除方案一外，也可以将商品价格 $p_{s}$ 离散化为可选价格集合 $P_{s} = [p_{s_{1}},p_{s_{2}},...,p_{s_{n}}]$ ，用(6)计算出对应的预测销量集合 $Q_{s} = [q_{s_{1}},q_{s_{2}},...,q_{s_{n}}]$ ，用 $r_{si} = p_{si}-c_{s}$ 表示商品价格 $s$ 定价为 $p_{s_{i}}$ 时所产生的的单个商品利润。然后建立如下模型：
$\max \sum_{s \in S}\sum_{i \in P_{s}} r_{si} \times q_{si} \times x_{si} \space\space\space (8)$
$\sum_{i \in P_{s}}x_{si}=1 \space\space\space \forall s \in S \space\space\space (9)$
$x_{si} \in \{0,1\} \space\space\space \forall s \in S, \forall i \in P_{s} \space\space\space (10)$
其中， $x_{si}$ 为 0-1 决策变量，表示商品 $s$ 的第 $i$ 个备选价格 $p_{si}$ 是否被选中；式(8)表示利润最大化的决策目标；式(9)表示每个商品 $s$ 只能制定一个价格。可以发现，上述模型是一个 0-1 整数规划模型。

分析实际业务，我们发现：

促销商品的价格基本是以 58、66、68、88、98、99 等吉利数字结尾。显然，方案二更适合于实际业务。 因此，我们采用方案二的建模方式求解促销定价问题。

4.2.3 业务约束

在实际的业务中，精细化定了除了保证利润最大化的决策目标，还需要对配合促销策略的开展。我们这里举一个例子：

本次促销需要保证总利润率（总利润/总成本）在 20%-30%之间；
同时用生鲜品进行引流，保证：
- 蔬菜类商品 $S_{v}$ 平均折扣率不低于 30%；
- 国产水果类商品 $S_{f}$ 平均折扣率不低于 20%；
- 猪肉类商品 $S_{p}$ 平均折扣率不低于 10%；

我们将如上约束转化为数学语言。定义 $d_{si}=\frac {o_{s}-p_{si}}{o_{s}}$ 表示商品 $s$ 定价 $p_{si}$ 时的折扣率。则数学公式可表示为：

$\le \frac {\sum_{s \in S}\sum_{i \in P_{s}} r_{si} \times q_{si} \times x_{si}} {\sum_{s \in S}\sum_{i \in P_{s}} c_{s} \times q_{si} \times x_{si}} \le 0.3 \space\space\space (11)$
$\frac {\sum_{s \in S_{v}}\sum_{i \in P_{s}}d_{si} \times x_{si}} {\sum_{s \in S_{v}}\sum_{i \in P_{s}}x_{si}} \ge 0.3 \space\space\space(12)$
$\frac {\sum_{s \in S_{f}}\sum_{i \in P_{s}}d_{si} \times x_{si}} {\sum_{s \in S_{f}}\sum_{i \in P_{s}}x_{si}} \ge 0.2 \space\space\space(13)$
$\frac {\sum_{s \in S_{p}}\sum_{i \in P_{s}}d_{si} \times x_{si}} {\sum_{s \in S_{p}}\sum_{i \in P_{s}}x_{si}} \ge 0.1 \space\space\space(14)$
上述公式中：式(11)表示总利润率在 20%-30%之间，分子表示总利润，分母表示总成本；式(12)(13)(14)分别表示蔬菜/国产水果/猪肉类商品平均折扣率不低于 30%/20%/10%，分子表示该类商品的折扣率之和，分母表示该类商品的商品数量。

4.2.5 数学模型

我们合并 2）、3）节内容，形成最终模型。由于引入式(11)(12)(13)(14)业务约束，模型可能无解并且存在非线性项不利于模型求解。因此，我们引入松弛变量保证模型可解；同时对模型进行不等式变换消除非线性项。

引入松弛变量

分别引入 $\alpha_{1},\alpha_{2},\beta_{v},\beta_{f},\beta_{p}$ 松弛变量。
$\le \alpha_{1} + \frac {\sum_{s \in S}\sum_{i \in P_{s}} r_{si} \times q_{si} \times x_{si}} {\sum_{s \in S}\sum_{i \in P_{s}} c_{s} \times q_{si} \times x_{si}} - \alpha_{2} \le 0.3 \space\space\space (15)$
$\frac {\sum_{s \in S_{v}}\sum_{i \in P_{s}}d_{si} \times x_{si}} {\sum_{s \in S_{v}}\sum_{i \in P_{s}}x_{si}} + \beta_{v} \ge 0.3 \space\space\space(16)$
$\frac {\sum_{s \in S_{f}}\sum_{i \in P_{s}}d_{si} \times x_{si}} {\sum_{s \in S_{f}}\sum_{i \in P_{s}}x_{si}} + \beta_{f} \ge 0.2 \space\space\space(17)$
$\frac {\sum_{s \in S_{p}}\sum_{i \in P_{s}}d_{si} \times x_{si}} {\sum_{s \in S_{p}}\sum_{i \in P_{s}}x_{si}} + \beta_{p} \ge 0.1 \space\space\space(18)$
$\alpha_{1},\alpha_{2},\beta_{v},\beta_{f},\beta_{p} \ge 0 \space\space\space(19)$

不等式变换

由于式(9)(10)(11)(12)的分母恒大于 0，因此将分母移到不等式的另一边不等式符号不改变。以式(14)为例，等价于：
$\sum_{s \in S_{v}}\sum_{i \in P_{s}}d_{si} \times x_{si} + \beta_{v} \times\sum_{s \in S_{v}}\sum_{i \in P_{s}}x_{si} \ge 0.3 \times \sum_{s \in S_{v}}\sum_{i \in P_{s}}x_{si} \space\space\space(20)$

又因为， $\beta_{v}$ 为松弛变量，且 $\ge 0$ 。所以，可将 $\beta_{v} \times\sum_{s \in S_{v}}\sum_{i \in P_{s}}x_{si}$ 等价为 $\beta_{v}$ 。因此，不等式可转化为：
$\sum_{s \in S_{v}}\sum_{i \in P_{s}}d_{si} \times x_{si} + \beta_{v} \ge 0.3 \times \sum_{s \in S_{v}}\sum_{i \in P_{s}}x_{si} \space\space\space(21)$

合并同类项，可转化为：

$\sum_{s \in S_{v}}\sum_{i \in P_{s}}(d_{si} -0.3) \times x_{si} + \beta_{v} \ge 0 \space\space\space(22)$

最终模型

因此，最终模型可表示为：
$\max \sum_{s \in S}\sum_{i \in P_{s}} r_{si} \times q_{si} \times x_{si} - M \times(\alpha_{1}+\alpha_{2}+\beta_{v}+\beta_{f}+\beta_{p}) \space\space\space (23)$
$\sum_{i \in P_{s}}x_{si}=1 \space\space\space \forall s \in S \space\space\space (9)$

$\sum_{s \in S}\sum_{i \in P_{s}} (r_{si}-0.3 \times c_{s}) \times q_{si} \times x_{si} + \alpha_{1} \le 0 \space\space\space (24)$
$\sum_{s \in S}\sum_{i \in P_{s}} (r_{si}-0.2 \times c_{s}) \times q_{si} \times x_{si} + \alpha_{2} \ge 0 \space\space\space (25)$
$\sum_{s \in S_{v}}\sum_{i \in P_{s}}(d_{si} -0.3) \times x_{si} + \beta_{v} \ge 0 \space\space\space(22)$
$\sum_{s \in S_{f}}\sum_{i \in P_{s}}(d_{si} -0.2) \times x_{si} + \beta_{f} \ge 0 \space\space\space(26)$
$\sum_{s \in S_{p}}\sum_{i \in P_{s}}(d_{si} -0.1) \times x_{si} + \beta_{p} \ge 0 \space\space\space(27)$
$x_{si} \in \{0,1\} \space\space\space \forall s \in S, \forall i \in P_{s} \space\space\space (10)$
$\alpha_{1},\alpha_{2},\beta_{v},\beta_{f},\beta_{p} \ge 0 \space\space\space(19)$
其中， $M$ 为极大地数，以便松弛变量尽可能取 0，及所有业务约束均被满足。

4.3 模型求解

我们选择ORTools 建模，并选择 SCIP 求解。

详见代码(文末加粉丝群获取~~~)

求解结果如下：

最优解状态： 0
总利润： 36880.27
总成本： 123319.58
总营收： 160199.84999999998
总利润率:0.2990625657336815
总折扣率:0.05771901890183243
蔬菜利润率:0.12843251752888687
蔬菜折扣率:0.2994485707115351
国产水果利润率:0.2352903707735693
国产水果折扣率:0.20145441470807798
猪肉利润率:0.2583410761044007
猪肉折扣率:0.14393190181238136

我们发现：

模型求得了最优解，所有业务约束均被满足。 这说明了：精细化定价可以保证商家的利润，同时也能让消费者买到低价的商品，实现双赢。

当然，本文讲解的是最基础版本的定价算法，在实际业务落地时还需要考虑其他细化条件，如：连续多天定价、库存情况等。但整体求解框架不会有太大的改动。

附求解log如下：

presolving:
(round 1, fast)       18 del vars, 6 del conss, 0 add conss, 0 chg bounds, 0 chg sides, 0 chg coeffs, 0 upgd conss, 0 impls, 0 clqs
(round 2, fast)       18 del vars, 6 del conss, 0 add conss, 0 chg bounds, 12 chg sides, 0 chg coeffs, 0 upgd conss, 0 impls, 0 clqs
(round 3, fast)       218 del vars, 8 del conss, 0 add conss, 0 chg bounds, 12 chg sides, 0 chg coeffs, 0 upgd conss, 0 impls, 0 clqs
(round 4, exhaustive) 4178 del vars, 8 del conss, 0 add conss, 5 chg bounds, 12 chg sides, 0 chg coeffs, 0 upgd conss, 0 impls, 0 clqs
   Deactivated symmetry handling methods, since SCIP was built without symmetry detector (SYM=none).
presolving (5 rounds: 5 fast, 2 medium, 2 exhaustive):
 4178 deleted vars, 8 deleted constraints, 0 added constraints, 8 tightened bounds, 0 added holes, 12 changed sides, 0 changed coefficients
 0 implications, 0 cliques
presolved problem has 185999 variables (0 bin, 0 int, 0 impl, 185999 cont) and 3184 constraints
   3184 constraints of type <linear>
Presolving Time: 9.00

 time | node  | left  |LP iter|LP it/n|mem/heur|mdpt |vars |cons |rows |cuts |sepa|confs|strbr|  dualbound   | primalbound  |  gap   | compl.
*24.0s|     1 |     0 | 44153 |     - |    LP  |   0 | 185k|3184 |3184 |   0 |  0 |   0 |   0 | 3.694357e+04 | 3.694357e+04 |   0.00%| unknown
 24.0s|     1 |     0 | 44153 |     - |   851M |   0 | 185k|3184 |3184 |   0 |  0 |   0 |   0 | 3.694357e+04 | 3.694357e+04 |   0.00%| unknown

SCIP Status        : problem is solved [optimal solution found]
Solving Time (sec) : 24.00
Solving Nodes      : 1
Primal Bound       : +3.69435660720141e+04 (1 solutions)
Dual Bound         : +3.69435660720141e+04
Gap                : 0.00 %
[I 21:09:48.234 NotebookApp] Saving file at /4.model_algorithm_elasticity.ipynb
[I 21:11:47.859 NotebookApp] Saving file at /4.model_algorithm_elasticity.ipynb
[I 21:13:48.244 NotebookApp] Saving file at /4.model_algorithm_elasticity.ipynb
[I 21:15:44.505 NotebookApp] Saving file at /4.model_algorithm_elasticity.ipynb
[I 21:15:48.779 NotebookApp] Starting buffering for b14080f5-0663-41c6-b4f6-ac64dcade9f1:9a94821c2c27446a9b8551c893a4613f
[I 21:15:50.912 NotebookApp] Kernel restarted: b14080f5-0663-41c6-b4f6-ac64dcade9f1
[I 21:15:51.976 NotebookApp] Restoring connection for b14080f5-0663-41c6-b4f6-ac64dcade9f1:9a94821c2c27446a9b8551c893a4613f
[I 21:15:51.976 NotebookApp] Replaying 3 buffered messages
[I 21:17:54.218 NotebookApp] Saving file at /4.model_algorithm_elasticity.ipynb
presolving:
(round 1, fast)       18 del vars, 6 del conss, 0 add conss, 0 chg bounds, 0 chg sides, 0 chg coeffs, 0 upgd conss, 0 impls, 0 clqs
(round 2, fast)       18 del vars, 6 del conss, 0 add conss, 0 chg bounds, 12 chg sides, 0 chg coeffs, 0 upgd conss, 0 impls, 0 clqs
(round 3, fast)       218 del vars, 8 del conss, 0 add conss, 0 chg bounds, 12 chg sides, 0 chg coeffs, 0 upgd conss, 0 impls, 0 clqs
(round 4, exhaustive) 4178 del vars, 8 del conss, 0 add conss, 5 chg bounds, 12 chg sides, 0 chg coeffs, 0 upgd conss, 0 impls, 0 clqs
   Deactivated symmetry handling methods, since SCIP was built without symmetry detector (SYM=none).
presolving (5 rounds: 5 fast, 2 medium, 2 exhaustive):
 4178 deleted vars, 8 deleted constraints, 0 added constraints, 8 tightened bounds, 0 added holes, 12 changed sides, 0 changed coefficients
 0 implications, 0 cliques
presolved problem has 185999 variables (0 bin, 0 int, 0 impl, 185999 cont) and 3184 constraints
   3184 constraints of type <linear>
Presolving Time: 10.00

 time | node  | left  |LP iter|LP it/n|mem/heur|mdpt |vars |cons |rows |cuts |sepa|confs|strbr|  dualbound   | primalbound  |  gap   | compl.
*28.0s|     1 |     0 | 44372 |     - |    LP  |   0 | 185k|3184 |3184 |   0 |  0 |   0 |   0 | 3.694604e+04 | 3.694604e+04 |   0.00%| unknown
 28.0s|     1 |     0 | 44372 |     - |   851M |   0 | 185k|3184 |3184 |   0 |  0 |   0 |   0 | 3.694604e+04 | 3.694604e+04 |   0.00%| unknown

SCIP Status        : problem is solved [optimal solution found]
Solving Time (sec) : 28.00
Solving Nodes      : 1
Primal Bound       : +3.69460373439469e+04 (1 solutions)
Dual Bound         : +3.69460373439469e+04
Gap                : 0.00 %

05 代码获取方式

加粉丝群后见群公告获取~~~

粉丝1群二维码：

加不了群，请加管理员微信：IndustryOR

参考文献

Hua J, Yan L, Xu H,et al. Markdowns in E-Commerce Fresh Retail: A Counterfactual Prediction and Multi-Period Optimization Approach[J]. arxiv, 2021.(https://arxiv.org/pdf/2105.08313.pdf)
Kui Zhao, Junhao Hua, Ling Yan, et al. A Unified Framework for Marketing Budget Allocation[J]. arxiv, 20.(https://arxiv.org/pdf/1902.01128.pdf)
用相关系数进行Kmeans聚类，利用利润率、打折率、销售额、毛利润得到商品价格弹性标签，建立价格折扣力度模型(https://blog.csdn.net/weixin_45934622/article/details/114382037)
2019全国大学生数学建模竞赛讲评：“薄利多销”分析(https://dxs.moe.gov.cn/zx/a/hd_sxjm_sxjmstjp_2019sxjmstjp/210604/1699445.shtml)
策略算法工程师之路-基于线性规划的简单价格优化模型(https://zhuanlan.zhihu.com/p/145192690)