“这模型解释不了?就别用了”

bf5dc2ccde9faed37b72e1f18a1c138e.jpeg

01

如题

谭老师我连续写了n篇大模型文章了。

有些研发高管朋友奉劝,

你别光写大模型,

这不是人工智能(AI)的全部。

说得太对了,

竟无言以对。

多谢提醒。

那就来个大小模型混合双打,

伏笔在在2024年春节前就已埋下。

那时,我收到线报,

罕见的美国的供应链大奖花落中国企业,INFORMS Prize。

再算上2023年的Franz Edelman,

连拿两个大奖,

奖项含金量极高。

美国人还挺识货。

这个团队我观察4年了,

有些员工的“工龄”,

没我“写龄”长。

(我2019年写的这个团队第一篇深度。)

这个团队算法贼多,

自动定价,自动补货,仓库选址,销量预测,

机器人任务分配……

我见证了其中不少。

因为读者里有猎头,

文中人物一律匿名。

团队的大名当然要先说:

京东零售智能供应链。

这篇写作的切入点就是本文标题:

“这模型解释不了?就别用了。”

这话,不是谭老师我说的,

而是一位京东采销大哥的原话。

京东有一个强大的采销团队,

有很强势品类组,

其所有组员的从业经验超过12年。

我见过一位母婴组的采销大哥,

手撕纸尿裤总数超过一万片。

他对整个纸尿裤的成本结构极其清晰,

单凭手摸,就有好坏之分。

ff0a4ae30d215fd740da65cd80e9c5cf.jpeg

这也难怪,

分不清好坏货,

进了一堆烂货怎么卖?

消费者多失望。

这组专家团队的背后,

2024年第一季度,

京东平台上纸尿裤的GMV将近30%的增长。

此后,我但凡见到京东采销,

都江湖称谓“大哥或大姐”。

采销是京东精锐中的精锐,

都说这年头唯一不涨的就是工资。

然而,上个月,

京东采销的年薪从16薪涨至20薪,

业绩激励上不封顶。

这些风里来雨里去,

往返供应链上下游的行业顶级专家,

需要软件和算法配得上他们专业程度,

在我看来,

京东智能供应链技术团队也不吃干饭。

这里有个从2018年到2024年的小故事,

值得让谭老师讲一讲。

02

你欠我一个解释

卖货买货,

物流是硬供应链,

算法是软供应链。

预测销量算法会影响下面好几步,

一步错,步步错。

供应链就是这样环环相扣。

不过,确实有算法大神能从供应链下游“捞”起失误,

如果某位大神恰巧在看这篇稿子,

那“一步错,步步错”就当我没说。

大部分的情况,是捞不起来,

所以,每一步预测都很重要,

还要考虑下一步,

8b31b1c2999da21f1cec4b1bd3d03063.png

对采销大哥来说,

只有你的AI算法准确率高到采销满意的程度,

或者说“跨过”某一条水位线。

采销才会使用AI算法来辅助工作。

俗称,“提建议”的资格。

一开始,采销会根据经验,

粗算一个数字

(比如,2000箱猫砂)。

预测算法也给一个数字,

AI算,人算,

居然和这个相差不多。

或者说猫砂这个品类,

有很大一部分都能“跨过水位线”。

采销自然会认为,

这个建议给得靠谱,

预测猫砂销量的难度在于,

仅靠短期历史销量是不够的,

因为猫砂有囤货属性,

买猫砂动不动就“一把下够”。

38184dd2b141ccd257ebc8bd846af520.jpeg

一来二去,智能供应链技术团队和采销大哥,

就建立起一个初步的信任。

愿意“采纳”AI给的建议。

再下一步,

出现一个搞笑的事。

采销上手,看到AI预测的销量后,

总会问围着算法问一堆问题。

对,一堆。

这个模型给我预测的销量,

为什么高?

为什么低?

为什么这个数?

母婴组在问,

宠物组在追问,

家电组的电话打进来了……

这么热门,

代表两件事,

采销重视AI给的建议,

如果认为没用,就直接无视了,

也不会问。

这些是AI落地的良性信号

也带出本文的核心:

总得有人把AI计算出来的结果解释清楚,

学术上和“AI的可解释性”有关系。

因为,AI中有些算法是黑盒。

所以,当采销要一个解释,

这个需求很像是一种“客服”,

不过,提供服务的是研发。

这时候,有人可能会误会,

你以为接入个大模型来回答问题就完了。

这可大错特错了,

已现在大模型的“智力”水平,

还是先把高考数学考好吧。

供应链上的答案是动态的,不躺在知识库里。

于是,有新需求,就有新悲剧。

这些高学历的博士,纷纷上岗“客服”。

某位算法博士说:

“采销每天给我灵魂三十问。”

某位采销大哥说:

“模型是他们设计的,我不问他们,问谁去?”

94f27727fdb978d2d4d0ac29d7ad5554.png

有一次,智能供应链算法负责人给我讲过一个段子,

曾经有段时间,

采销团队人人化身“十万个为什么”,

从周一问到周五,

从线上问到线下,

算法同学都快扛不住如此的问答强度了。

不就是问个问题,

有什么强度?

因为回答“为什么”的成本是巨大的。

第一,可能要做几趟数据分析,

一个问题里可能有好几个数。

第二,可能在一堆历史数据查来查去,

第三,其他解释工作

一些科普,

甚至贡献职场情绪价值。

这样,有的研发小哥哥仰天长啸了,

互联网嘴替在哪?

故事这样发展下去,

我有一种预感,

对于技术天才型选手来说,

你信不信,

他们反手设计一个模型,来解决。

一个不够,

那就再来一个。

不出意外的话,

他们真这么干了,

这个故事越来越有看点了。

不过,我还要再补充两句:

可解释性。

这可是AI几大未解之谜之一。

科学界,有一批专家致力于解决。

电商公司里,

也有一批人,

再不解决“可解释性”,

就头疼死了。

这是一个企业里普遍存在的难题

研发需向业务十分清楚地解释,

模型计算结果怎么来的。

这件事,并非无关痛痒,

而是一种强刚需。

你可能会听到这样的吐槽:

“甭管什么贝叶斯,马尔科夫,

这两个歪果仁,我也不认识,

你就告诉我,这5000件,怎么预测出来的?”

听上去,氛围有点紧张,

不紧张不行呀,

最后为业绩负责的是采销。

不是AI。

如果不妥善解决,

采销还可以放一个大招,

抵制AI

此处,建议回想一下本文的标题。

不用AI怎么办?

采销还可以依靠十年采销经验,继续上班领工资。

然而,有人就要说拜拜了。

那AI算是废了。

03

好难,零售供应链上的运筹学

说点掉书袋的,

可解释性是模型可观测性的一个环节,

可观测性是AI在工业生产环节最重要的工程基础。

什么意思呢?

黑盒中看不到出错的地方,

也就没有办法调试,

对了就对了,

错了就错了。

谁都没办法。

能观测整个过程可就太好了,

因为出错在工业界是高成本的。

软件的每一步都透明,

好比,透明厨房一样,

步步都在大家视线范围内。

这个软件干完,下个软件接着,

或者好多个软件模块都参与了,

哪出了错?为什么错?

这个时候,模型的可解释性对模型的准确率,

又多了一层意义,

不只是解除采销大哥的“紧箍咒”,

从技术层面,“可解释性”,

因为能够观测,追踪到很多错误发生的时间地点,

进而可找到错误,提高模型精度,

真的是一石二鸟。

一开始不了解供应链的时候,

我曾有一个错误想法是,

补货有啥必要上算法,

参考平均每天卖了多少,

补多少货。

可以用规则?

比如,一律余货还有10%的时候补货。

小学数学应用题。

谭老师我这种想法,

还停留在小卖部卖辣条的时代,

但是情况太复杂了,

约束条件非常多,

影响因素来自四面八方,

用规则反而成本更高。

比如,所有供应商送货时间不可能整齐划一,

其次,京东平台对接了多少供应商?

这事不用细讨论,

时代在发展,

规则能完全搞定就不用AI出场了。

“零售供应链中的运筹学 (OR)”,

这门学科势必用上AI:

正确姿势是,

对大型集团式企业来说,

跨过供应链的多个环节,

从始至终,

从历史到未来,

达到总成本最优。

而且完成各类目标,

会受到五花八门的约束,

这样一个独特的,

非常复杂的优化业务场景,

你怎么用数学表达出来?

也就是,把业务变成数学语言。

我得开始讲技术干货了,

毕竟,我是一个科技科普博主。

98034d979cdafb66f13bea3ddbf67c4d.png

04

用算法解释算法

有多少因素影响销量?

说不清,可太多了,

大到气候,小到天气,

大到宏观,小到毫末,

都会影响销量,

摸不清楚,就管理不了。

管理零售的本质是,

抓住主要矛盾还不够,

而是抓住所有值得抓住的细节,

细节特别多,巴不得每个细节考虑,

挂一漏万,就会失控。

而今不同,这件事情AI算法参与进来了。

可是,有的AI算法是黑盒。

所以,京东智能供应链技术团队,

考验你们的时候到了。

2018年那个阶段,

研发一直思考,

既然暂时不能精确解释,

那怎么也得把一些关键的因素给处理出来,

简单地说,就是至少给到采销大哥一些趋势性的信息。

然而,精确解释再往下做,就很难了。

难度有多大呢?

美国有一家知名电商,我不说名字,

它家把在美国用的好好的算法,

拿到中国,发现算法“失灵”了,

为啥?

因为国内电商打得太猛了,

成天搞活动,

这个“大促销”,那个“大降价”。

同一种算法,换一片土地,直接“下岗”。

越是突发性的促销活动多,

销售不规律的波动越大,

既难以预测准,又难以解释,

再加之,

京东的场景比较奇葩,

覆盖的品类宽度太宽了。

每个品类下面都有很多常规品。

有的商品,一周全国仅仅卖个一件两件,

预测和解释都很费劲。

智能供应链技术团队负责人对我说的原话是:

“非常难做。”

费劲也得干。

在谭老师我省略了5000字之后,

团队终于出了拿出了一个“重磅武器”,

我就不讲过程了,

直接聊结果。

不过,我还是要再笑一遍,

算法专家的“脑回路”。

不要误会,

笑声中充满了敬佩。

我笑,如我所料,

果然,研发同学实在无法忍受,

来自采销大哥的“每日灵魂发问”,

他们终于拿出了自己最擅长的,

设计一个算法,

用算法来对算法结果进行解释。

虽然禁止俄罗斯套娃梗,

但是道理就是这么个道理。

一分钟讲完解释版本就是,

好比,程序员们遇到难题,

最先想到的是写一段程序帮忙,

算法专家遇到难题,

一口气写了四个模型,

三个模型,

分别代表前三个最主要的影响因素,

再用第四个模型,

给这前仨打分,

打出“对销量贡献得分”。

每个得分,都相当于一种权重,

简单说,谁贡献最大,就给权重高,

以此类推。

看看表,一分钟还不到。

详细版本是:

给三大影响因素背后的算法做了针对性设计,

也就是每个因素,

背后总得有一个模型在计算吧。

要不怎么说针对性。

这三种模型,分别是

基线模型,长期营销模型,短期促销模型。

第四个模型是残差网络结构

长期,短期意如其名。

基线就是你啥也不干,躺平。

为什么对这仨建模?

因为这仨对销量影响最大。

这三个模型其中一个短期促销做得特别好,

95%都是它贡献的,

那最后要乘一下权重,95%。

那就是短期促销为最终销量贡献了95%。

简单数学加法版的解释就是,

假设,基线是50件。

营销活动增加20件,

促销活动会增加30件。

20+30+50=100件。

采销大哥:原来100件销量是这么来的。

这是一种反向分析,到底哪个因素贡献多少。

好消息是,我们第二天就会知道前一天的真实销量,

再用真实销量做标签,学习一遍,

a3b8df86355c99253b3eb2cfec35a68c.png

这不是一种只能用于零售的方法,

而是一种思路,

还可以用在很多事情上,比如用电量。

学霸可移步学术论文区:

https://onlinelibrary.wiley.com/doi/abs/10.1111/poms.13892

我引用另一个获奖文件(Gartner技术创新)里的原话:

“京东开发了一种可解释的需求预测模型。

该模型通过自我学习,

实现了对需求预测过程的一定程度的理解(白盒),

具有因果决策逻辑、

准确预测分解,

和交互式预测模拟。”

2023年到2024年,大模型时代,

京东智能供应链技术团队希望,

有一个时序大模型能一把搞定。

因为京东的商品品类还是会日益增加,

让大模型来找商品和品类中的规律。

目前正在探索之中。

谭老师我认为,

不迷信大模型,

按成本考虑,

小模型玩得溜,

成本上的优势太大了。

京东有千万级别(SKU)自营商品。

市场上,有些知名企业,

哪怕只有三到五万商品(SKU),

都管不好。

京东把这个千万量级的产品,

管理到29天的库存周转天数。

这是人类(京东团队)和AI一起干出来的,

一个载入供应链史册的好成绩

24c11da55772a80d53fbf99aec7aae02.jpeg

(完)

One More Thing

预测销量的时期,还只是点预测

这一步做完之后,

团队一直在迭代,

考虑怎么去做得更好。

后来,进入了分布预测时期

英文名称,Distribution Predict。

这种预测,很复杂,

留给学霸参考:

因为下游的补货模型是个概率模型。

也就是把预测概率分布考虑进去。

预测50件的概率是80%,

预测卖70件的概率是70%,

算一个非常长的范围。

把一连串结果都给下游补货同学参考。

感觉智能供应链好玩的还很多,

考虑还能再写一篇。 

f50454f7c9be028a385af6c3ef767e7f.jpeg

24cb2deec24690ed1b53538b016cc3a4.jpeg

《我看见了风暴:人工智能基建革命》,

作者:谭婧

ab9e42daf6bfe42d5bb6c58761417919.jpeg

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值