如何基于匹配预设句式,动态提取用户评价标签

本文介绍了如何通过匹配预设句式动态提取用户评价标签,解决预设标签不足和句法分析的问题。文章详细阐述了标签系统结构、建立句式库和句式匹配的具体步骤,旨在提升用户体验和平台转化率。
摘要由CSDN通过智能技术生成

网络经济的发展使我们的消费渠道早已不止于实体场景。来自于用户的线上评价,成为如今影响我们消费行为决策的重要因素。

背景

在网上购物时,即使你已经浏览了商家对于商品的描述,你还是不会立即决定购买它,因为你不确定这些描述是否准确。这时你会寻找其他购买过此商品的用户评论,这些评论可能才会最终说服你。

购买旅行类产品也是一样。每天都有大量用户在马蜂窝平台用“评论”的方式,记录和评价他们在旅行中的感受和体验。而基于对评论内容深度挖掘产生的标签,则用一种更为简洁、直观的方式汇总评论信息中的重要内容,展示给更多的用户作为参考依据。

因此,如何在保证标签内容准确性的同时,体现出更符合用户语言习惯、让用户更容易理解的标签含义,对于提升用户在马蜂窝平台的体验,做出更符合自身需求的旅行决策,以及提升平台转化率、更好地监管商家服务品质等方面,都有很大价值。

从评价中提取标签的方式有很多,但在实际应用中存在一些问题,比如:

1. 预设标签
  • 做法:预先定义好一些固定标签,由用户在发表点评时自主选择。

  • 不足:固定标签数量受限,无法覆盖用户全部需求,并且标签和用户内容可能不匹配。

2. 句法分析
  • 做法:对用户发布的点评内容进行解构,提取主题词和描述词组合后作为标签。

  • 不足:在评价量非常大的时候,这种方法会产生大量标签,对计算性能要求高,并且维护不便。

3.多层级标签定义
  • 做法:预先定义标签大类,在逐级细分,最后产生具体标签。

  • 不足:产生大量维护工作。并且定义的层级灵活性欠佳,而且匹配的标签是关键词加指标词,不能很好地表达用户的言语习惯。

为了解决以上问题,马蜂窝推荐和搜索研发团队提出了一种通过匹配预设句式的模式,灵活、动态提取用户评论标签的方式,将每个预设句式归宿到固定标签分类,在分类显示中动态地采用最大数标签作为整个分类标签的显示方式,极大减少了固定标签的数量,并且每个句式是任意的多个词组联合组成,使最终提取的标签内容在更符合用户语言习惯的同时,更好地体现了不同评论内容标签的个性化和差异化。

基于匹配预设句式模板动态提取用户评价标签

首先和大家解释几个关键的概念。

  • 标签:标签可以理解成对一个给定信息进行的具体描述。比如“离望京地铁站近”、“步行到大望路地铁站 1 分钟”等;

  • 句式:这里,我们可以先简单理解成是对同一类型标签的集合,可以理解成“评价方式”,比如上句关于标签的举例,都是对“离地铁站近”的评价;

  • 标签类别:同样,我们先简单理解成是对同一类句式,也就是一

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值