laravel 分词搜索匹配度_从用户意图提升搜索匹配准确率和召回率实战案例-boss直聘...

bb1bce41aa17b7f4a67535952e32ddeb.png

案例一:人工智能产品经理搜索召回率低的问题

一、发现问题

针对人工智能产品经理搜索结果中存在的问题:部分岗位的岗位名称中未包含,AI、人工智能、语音识别、NLP等关键词,但是其工作内容或内容二级标签中包含AI、人工智能等关键词,此类岗位未判定为人工智能产品经理岗位,例如下图所示。

b18d10d0c0a02a1e7e827c0cd19f5ec0.png

整理后台岗位中工作内容含有“AI”等关键词未被识别为人工智能产品岗位数量,被机器标识为人工智能产品经理数量,计算得到召回率为z,可看出召回率较低:

召回率z=x/y*100%

二、问题的相关指标

目的:优化岗位匹配策略,能够准确解析工作内容中与搜索词相关的主题词,提升召回率

关键指标:

召回率=策略识别有人工智能产品经理的数量/数据库中应该被识别为人工智能产品经理的数量

需求文档

一、需求背景

通过用户搜索历史发现,人工智能产品经理的需求识别召回率为z,数据不理想,有提升的空间。

二、需求目标

优化搜索词与岗位的匹配策略,使得搜索词能够准确匹配工作内容中的关键词,提升召回率。

关键指标:

召回率=策略识别有实际人工智能产品经理的数量/数据库中应该被识别为人工智能产品经理的数量

三、需求概述

1.工作内容的分词

算法:结巴分词,百度分词

关键词:AI、人工智能、语音识别、NLP等

2. 工作内容分词的主题词抽取

算法:LDA算法

3. 匹配策略

步骤如下:

(1)搜索词匹配岗位名称

(2)搜索词匹配工作内容主题词

案例二:天津地区搜索意图为互联网产品经理匹配结果含非互联网产品的问题

一、发现问题

针对天津地区产品经理搜索结果中存在的问题:部分岗位的岗位名称为产品经理,其工作内容非产品经理岗位工作内容,故此类岗位不应判定为互联网产品经理岗位。

整理后台天津地区岗位名称为产品经理,但工作内容非互联网产品经理岗位数量,计算被机器标识为产品经理的准确率z,可看出准确率较低:

准确率=x/y*100%

二、问题的相关指标

目的:优化岗位匹配策略,岗位名称与搜索词匹配的情况下,校验岗位工作内容是否是用户意图的工作内容,从而提升匹配准确率

关键指标:

准确率=策略正确识别产品经理的数量/数据库中识别为产品经理的数量

需求文档

一、需求背景

通过用户搜索历史发现,天津地区产品经理需求识别准确率仅有z,数据不理想,有提升的空间。

二、需求目标

优化搜索词与岗位的匹配策略,在能够准确匹配搜索词喝岗位名称的前提下,校验工作内容中的关键词,提升准确率

关键指标:

准确率=策略正确识别产品经理的数量/数据库中识别为产品经理的数量

三、需求概述

1.工作内容的分词

算法:结巴分词,百度分词

关键词:AI、人工智能、语音识别、NLP等

4. 工作内容分词的主题词抽取

LDA算法

主题词对应行业分类

5. 匹配策略

(1)搜索词与岗位名称匹配

(2)搜索词与工作内容对应行业匹配

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值