电商搜索革命：大模型如何重塑购物体验？

京东云开发者

于 2024-08-19 15:06:36 发布

阅读量596

点赞数 19

文章标签： java

本文链接：https://blog.csdn.net/jdcdev_/article/details/141325944

版权

自我介绍：京东零售搜推算法部算法工程师，专注于大模型技术以及在 AI 助手搜推等领域的应用探索和实践。在 AI 助手，NLP 和搜索领域有十多年研发实践经验，在 AI/NLP 领域申请超过 15 项发明专利并出版两部著作。

随着电商行业的蓬勃发展，搜索技术作为连接用户与商品的桥梁，其重要性日益凸显。在技术不断革新的今天，电商搜索技术经历了哪些阶段？面对大模型的飞速发展，企业又将如何把握趋势，应对挑战？为了深入探讨这些问题，我和InfoQ栏目探讨了电商搜索技术的发展历程、当前的应用状况以及面临的挑战和未来的发展方向。以下是采访的详细内容。

InfoQ：在您看来电商搜索经历了哪些阶段？

翟周伟：我从技术发展的角度讲下，本质上电商搜索技术演进的驱动力是通过不断的技术创新去实现更低的成本，更高的效率，以及更好的用户体验，可以划分为 4 个阶段：

第一是文本检索阶段，主要基于基础文本检索技术和以规则统计为主的人货匹配；

第二是机器学习阶段，以统计 NLP 技术为核心的用户意图理解和商品理解，利用机器学习模型对 UCTR 和 UCVR 进行建模提升转化，并在人货匹配上引入 LTR 等排序模型提升相关性，同时利用用户搜索行为反馈数据来优化效果；

第三是深度学习阶段，核心是 DNN 技术驱动，包括基于深度模型的意图理解和商品理解显著提升了需求分发的准确性，在商品搜索上引入了 ANN 语义向量召回，多模态召回，DNN 匹配技术，交互上除了文本交互还支持以 DNN 技术为核心的语音和图像商品搜索交互，排序上支持个性化搜索可以千人千面的商品展示；

第四是大模型阶段，正是当下正在经历的阶段，首先是交互的改变，从单向的需求引导到双向的对话式自然语言交互，基于大模型的用户理解和商品理解有效解决了长尾泛化问题，在召回和相关性上大模型也正在重构整个技术架构，包括极具有颠覆潜力的大模型生成式检索技术的探索和应用。

InfoQ：在京东或者在电商平台，大模型主要应用于什么方向？可否举几个例子？

翟周伟：在电商领域主要在用户交互，意图理解和商品理解，商品召回和相关性，以及文案创意生成等方向。在用户交互上重点利用大模型的对话能力进行对话式交互导购，例如我们的京言 AI 助手，意图理解和商品理解上核心是利用大模型的超强理解能力进一步提升用户需求识别的准确性以及商品信息的精准建模，商品召回和相关性上的一个典型例子就是用大模型做商品的增强召回，用大模型对用户需求和商品 SKU 做相关性，文案生成应用上利用大模型来生成图文并茂的营销文案，大模型评论总结等。

InfoQ：这些应用有哪些实际落地的困难？

翟周伟：第一个首要问题就是通用大模型对商品知识的理解能力比较弱，直接应用没有明显效果优势；第二个问题就是个性化 Context 理解问题，大模型在理解用户购物偏好，用户评论，商品细节上存在个性化效果挑战；第三个就是时效性问题，大模型本身数据更新很慢，知识陈旧，而新商品，促销，价格等时效性更新超高频；第四个就是成本和速度问题，大模型训练和推理成本很大，大规模使用会面临 ROI 低的问题，在线推理速度也很难满足系统实时性要求；最后就是安全问题，大模型存在敏感数据泄露风险，以及生成内容的安全合规等问题。

InfoQ：大模型实时信息获取和专业信息处理能力的能力应该是非常重要的一环，京东的解决思路是什么？目前可以做到什么程度或者说效果？

翟周伟：我们的解决思路主要通过两种方法，第一是新数据和新知识的增强持续预训练，第二就是 RAG，包括电商知识图谱 KG-RAG，商品搜索 RAG，Web 搜索 RAG。通过这些技术手段我们的大模型在电商领域任务上显著高于通用大模型，并且通过 RAG 可以做到实时性信息更新。

InfoQ：如何构建一个好的大模型电商搜索引擎？在您看来需要哪些原则或者考虑？

翟周伟：大模型电商搜索引擎的核心是所使用大模型的能力决定的，这个能力不仅仅是在通用领域的性能，关键在于大模型对于电商用户的理解，对商品的深刻理解，对电商场景的理解，以及在整个电商应用任务上的性能表现，因此核心考虑是如何构建一个高性能的电商大模型能力底座，以及性能评估体系。

这个也是当前我们的工作重点，启发于人类学习总是在前人积累的知识和经验上进一步学习，我们提出了一种继承学习方法来持续学习，在数据上通过提升知识密度和配比调整，通过模型结构优化，退火学习，多阶段指令对齐优化，增强安全治理对齐等方法提升我们电商大模型的性能表现。

InfoQ：大家都说大模型好，但是目前行得通的商业模式目前还不多，您认为企业，大家对于大模型的投入产出比如何？

翟周伟：大模型表现的涌现能力让人震惊，基于大模型的各种应用层出不穷，但到目前为止还没有出现所谓的大模型超级应用，也没有出现颠覆性的商业模式，由于大模型研发成本非常大，各种基于大模型的原生应用，包括一线大厂和创业公司的各种 AI 助手类应用还都处于亏损阶段，因此 ROI 是很低的，但大模型应用的商业潜力巨大，这种商业探索非常值得。

同时另一个方面是利用大模型去优化成熟商业模式业务中的效果，重点在于解决中长尾问题，在这个方向上 ROI 还是可以的，已经产生了商业价值。

InfoQ：理想中的下一代 AI 电商搜索是什么样的？

翟周伟：理想的下一代 AI 电商搜索在技术上应该是完全大模型驱动或 AGI 技术驱动，产品形态上应该是一个数字虚拟助理，类似电影《Her》中出现的超级 AI 助手，在交互上可以和人类进行全模态的自然语言交互，可以直接进行无障碍的流畅语音交互，同时具有听觉，视觉，以及空间感知等能力，可以精准基于用户需求直接推荐最匹配的商品，并给出精准的商品总结，以及为什么满足需求，性价比等，在需求不明的时候可以进行拟人的交互式导购，并可以智能的通过 AI Agent 技术在用户授权下自动下单，包括后续的物流，售后服务都可以由 Agent 来完成，用户只需要下达命令即可。

InfoQ：可以看的出京东也是比较重视大模型的投入的，在您看来一般企业开发或应用大模型的门槛是不是比较高？对于企业开发和应用大模型有哪些建议？

翟周伟：在我看来，对于一般企业做大模型应用的门槛其实是相对比较低，至少是比传统的 AI 应用门槛低，是因为大模型改变了 AI 应用的研发范式，只需要会写 prompt 就可以使用大模型，而且效果不错，虽然应用门槛变低了，但要做好大模型应用的门槛是变高了，是因为一旦涉及到具体的业务场景深度效果优化就需要优化大模型本身，而大模型研发成本和技术门槛还是比较高，首先训练和推理资源投入就很大，数据也需要很大成本，技术上涉及到预训练，SFT，DPO，PPO，MOE 等技术，要做好还是有门槛的。在应用上我有两点建议：

第一：如果偏向创新产品，建议初期直接调用大模型云服务 API，以 prompt 方式先把产品做出来，先跑通商业模式，尽快建立用户反馈，有一定用户规模后再考虑是否研发自己的大模型。

第二：如果需要优化大模型，建议以性能和商用友好的开源大模型作为底座从而降低训练成本，可结合应用在预训练增强，指令对齐上进行优化，也可以开源模型做初始化进行模型扩展或压缩以适应业务需求。