三、调试我们的第一个相关性问题
使用Elasticsearch
TMDB数据集在https://github.com/o19s/relevant-search-book中tmdb.json
python实现函数
reindex函数,重建Elasticsearch索引,并放入其中。
Query DSL领域特定查询语言
TF-IDF
四、驾驭token
文本分析所生成的token不仅代表查询的特征,也代表文档的特征
带着意图和语义来进行分析,会极大地提升搜索的相关性。
五、多字段搜索基础
排名函数
对于多个字段的评价--即多个信号---需要被合并成一个总的相关性评价才行,这样才能平衡所有对用户或业务而言的重要因素。这就是排名函数的目标。
源数据
六、以词为中心的搜索
七、调整相关性函数
构造排名函数
八、提供相关性反馈
引导用户搜索
九、设计以相关性为核心的搜索应用
十一、语义和个性化搜索
引入推荐的概念。
主要的不同之处在于,这里并不是只从文档中提取信息,我们还会将用户本身看作一种新的信息来源。