搜索
文章平均质量分 54
Catherine_In_Data
这个作者很懒,什么都没留下…
展开
-
业界搜索相关优化策略整理
加深印象,待进一步更新…1. 美团旅游搜索:困难:1)本异地差异大2)搜索意图多样3)底层脏数据多完整搜索系统:检索召回, 查询分析, 智能排序和业务应用。以下重点,检索召回, 查询分析用户行为链条: 搜索Query->点击搜索结果列表夜中的POI/Deal等->下单支付-> 消费–>计算消费收入。点击率链条太短,最终消费因素复杂。 行为链条如下:每搜索用户收入 = 点击用户数/搜索用户数 * 支付用户数/点击用户数 * 消费用户数/支付用户数 * 每用原创 2022-02-10 11:13:51 · 251 阅读 · 0 评论 -
搜索相关性方法
基于bm25的改进https://tech.meituan.com/2017/06/16/travel-search-strategy.html美团点评旅游搜索召回策略的演进, 关于相关性跟进的方法。参考BM25公式。主要考虑点:1)考虑不同文本域权重不一样,其中H表示文本域集合,名称, 品类等。i_f是命中域的动态权重,可以根据命中Term在Query中的比例或权重来设置w_f是f的权重,比如POI名称域的权重一般会高于Deal标题域lf是文本域f的长度文中这里取max,是担心某个域的缺.原创 2021-12-22 15:19:39 · 157 阅读 · 0 评论 -
Lucene中打分机制
主要是个人学习使用,如有问题,烦请指正。Elasticsearch 中explain评分分析:解释document评分怎么来的。即query与doc匹配得分。原理:综合query中每个term与文档的打分。 对query, doc进行综合打分排序。term 与query打分: 主要参考: term自身tfidf, doc自身特性, query特性。 总体为: query weight, field weight(这里的field理解为doc可能更好些)文章末尾: https://www.原创 2020-12-24 11:41:56 · 527 阅读 · 0 评论 -
高德搜索技术
自己整理关键知识点(还要再看一遍更新):文章名:机器学习在高德搜索建议中的应用优化实践原文链接:https://mp.weixin.qq.com/s/D3qxlzZgwnMprzEVuMpmggGbrank样本构建: session划分,末尾query点击,则智能整个session点击。模型调参:loss调整。基于两个样本特征差,修改loss负剃度。差异越大,负剃度越大。稀疏特征提取,截图文章名:深度学习在高德POI鲜活度提升中的演进原文链接: https://mp.weixin.qq.co原创 2020-06-29 10:20:56 · 390 阅读 · 0 评论 -
搜索--优酷搜索整理
评估指标搜索用户价值体现1)工具属性: 用户将搜索服务作为工具,搜索基础属性。 找准找全指标:跳出率, 相关性,时效性,多样性。人工评测: 满意度2)分发属性: 用户消费更多内容。指标: VV(video view, 视频播放的次数) 和消费时常。用户满意度直接体现。3. 搜索系统框架大概理解了一句, query过来后传递给 QP,QP 进行成分分析。搜索算法框架1) 两个模块: searcher模块, RankService 模块。2)query相关性计算主要是..原创 2020-06-24 10:15:24 · 458 阅读 · 0 评论 -
搜索(2) --丁香园
整理自:https://mp.weixin.qq.com/s/WRVwKaWvY-j-bkjxCprckQquery理解包含部分:1)短文本正确理解: 实体词识别,纠错,意图识别2)长文本良好结构化: 关键词抽取,主题词抽取,文本分类3)排序模型(召回策略, LTR, 语义匹配)注: 召回是搜索的基石。召回优化过程1)首次,产品分析,用户调研,修改检索字段或公式,生成baseline。2)其次,问题分析:无匹配内容, 最匹配内容靠后, 除了字面匹配,其他内容相关性差。3)再次,优化原创 2020-06-09 18:16:16 · 327 阅读 · 0 评论 -
搜索 (1)---京东
参考:https://mp.weixin.qq.com/s/4UBehc0eikVqcsFP7xL_Zw1 京东电商语义检索说商品排序(1) 背景主要内容:1)Query 理解query纠错, 改写,扩展, 分词2) 召回阶段向量检索3)排序(2) 向量检索1)传统倒排索引,只能检错资源意义。2)向量topk召回。 近似检索方法: KDTree, TDM, LSH, PQ, HNSW.3)打分计算函数: inner product L2 distance4) Multi he转载 2020-06-09 17:33:58 · 274 阅读 · 0 评论