随着互联网的高速发展带来了信息过载问题,给人们获取和理解所需要的信息带来了障碍。因此产生许多精华概要式服务模式,例如罗振宇的60秒语音、快速讲书、快速讲电影等等,都是通过提炼核心信息服务受众。近年来AI技术取得了巨大的进步,尤其是在自然语言处理的文本生成领域,具有十分广泛的产业化应用前景,不仅可以基于文本,还可以基于图片等多模态信息,凝练生成优美的文案。2020年OpenAI发布的1750亿参数的GPT-3,其写作水平能够与人类媲美。
京东发现好货-西门子文案
京东发现好货-海蓝之谜文案
京东已在自身业务中大规模应用了文本生成技术,可以在短时间内为用户撰写精美的商品摘要文案,并根据用户喜好推荐给用户“种草”,京东言犀基于领域预训练K-PLUG的商品文案生成模型已经覆盖了京东的3000+个三级品类,人工审核通过率90%以上,已经累计生成文案30亿字,应用于京东发现好货频道、搭配购、AI直播带货等,商品摘要文案反映了商品最独特的差异化价值,最大限度地促进用户的购买,已累计带来超过3亿元GMV。此外,言犀还可以拥有写诗、写春联、书法创作等多种AI能力。
京东发现好货-卧式冰箱文案
商品摘要文案挑战主要来源于三个方面,首先,信息的来源丰富,包含标题、商品规格、产品海报等信息;其次,需要处理多模态和结构化的信息,包含文字和图像各类信息,以及商品规格参数等结构化信息;再次,AI系统必须要足够智能,能够充分挖掘商品的卖点信息,并在合适的时间,千人千面的推荐给恰当的用户。
基于此,京东言犀开放了京东真实场景的脱敏数据,携手NLPCC 2022举办多模态商品摘要挑战赛。该任务旨在为一个指定商品生成一段凝练的文本摘要,给定的输入包括商品详细文本描述、商品知识图谱和商品图片。以下将介绍该任务的定义、数据集和评测方法。