如何基于匹配预设句式，动态提取用户评价标签

最新推荐文章于 2023-12-08 11:47:15 发布

马蜂窝技术

最新推荐文章于 2023-12-08 11:47:15 发布

阅读量870

点赞数 2

分类专栏：技术干货文章标签：句法分析标签提取数据挖掘

本文链接：https://blog.csdn.net/weixin_43846997/article/details/88422556

版权

本文介绍了如何通过匹配预设句式动态提取用户评价标签，解决预设标签不足和句法分析的问题。文章详细阐述了标签系统结构、建立句式库和句式匹配的具体步骤，旨在提升用户体验和平台转化率。

摘要由CSDN通过智能技术生成

PHP 技能精进之 PHP-FPM 多进程模型

网络经济的发展使我们的消费渠道早已不止于实体场景。来自于用户的线上评价，成为如今影响我们消费行为决策的重要因素。

背景

在网上购物时，即使你已经浏览了商家对于商品的描述，你还是不会立即决定购买它，因为你不确定这些描述是否准确。这时你会寻找其他购买过此商品的用户评论，这些评论可能才会最终说服你。

购买旅行类产品也是一样。每天都有大量用户在马蜂窝平台用“评论”的方式，记录和评价他们在旅行中的感受和体验。而基于对评论内容深度挖掘产生的标签，则用一种更为简洁、直观的方式汇总评论信息中的重要内容，展示给更多的用户作为参考依据。

因此，如何在保证标签内容准确性的同时，体现出更符合用户语言习惯、让用户更容易理解的标签含义，对于提升用户在马蜂窝平台的体验，做出更符合自身需求的旅行决策，以及提升平台转化率、更好地监管商家服务品质等方面，都有很大价值。

从评价中提取标签的方式有很多，但在实际应用中存在一些问题，比如：

1. 预设标签

做法：预先定义好一些固定标签，由用户在发表点评时自主选择。
不足：固定标签数量受限，无法覆盖用户全部需求，并且标签和用户内容可能不匹配。

2. 句法分析

做法：对用户发布的点评内容进行解构，提取主题词和描述词组合后作为标签。
不足：在评价量非常大的时候，这种方法会产生大量标签，对计算性能要求高，并且维护不便。

3.多层级标签定义

做法：预先定义标签大类，在逐级细分，最后产生具体标签。
不足：产生大量维护工作。并且定义的层级灵活性欠佳，而且匹配的标签是关键词加指标词，不能很好地表达用户的言语习惯。

为了解决以上问题，马蜂窝推荐和搜索研发团队提出了一种通过匹配预设句式的模式，灵活、动态提取用户评论标签的方式，将每个预设句式归宿到固定标签分类，在分类显示中动态地采用最大数标签作为整个分类标签的显示方式，极大减少了固定标签的数量，并且每个句式是任意的多个词组联合组成，使最终提取的标签内容在更符合用户语言习惯的同时，更好地体现了不同评论内容标签的个性化和差异化。

基于匹配预设句式模板动态提取用户评价标签

首先和大家解释几个关键的概念。

标签：标签可以理解成对一个给定信息进行的具体描述。比如“离望京地铁站近”、“步行到大望路地铁站 1 分钟”等；
句式：这里，我们可以先简单理解成是对同一类型标签的集合，可以理解成“评价方式”，比如上句关于标签的举例，都是对“离地铁站近”的评价；
标签类别：同样，我们先简单理解成是对同一类句式，也就是一

最低0.47元/天解锁文章

马蜂窝技术

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
如何基于匹配预设句式，动态提取用户评价标签

PHP 技能精进之 PHP-FPM 多进程模型背景1\. 预设标签2\. 句法分析3.多层级标签定义基于匹配预设句式模板动态提取用户评价标签标签系统总体结构具体做法和实施步骤一、建立句式库**二．句式匹配，生成标签**小结网络经济的发展使我们的消费渠道早已不止于实体场景。来自于用户的线上评价，成为如今影响我们消费行为决策的重要因素。背景在网上购物时，即使你已经浏览了商家对于商品的描述，你还是...
复制链接

扫一扫