- 博客(1)
- 收藏
- 关注
原创 Coggle 30 Days of ML(24年1/2月)-汽车知识问答RAG
构建倒排索引:通过对文档集合进行分词,得到每个文档的词项列表,并为每个词项构建倒排列表,记录包含该词项的文档及其位置信息。TF-IDF的最终值是将词项在文档中的频率和在整个文档集合中的逆文档频率相乘,这样可以得到一个更全面的评估,既考虑了在文档中的重要性,也考虑了在整个文档集合中的稀有性。块大小的选择取决于应用的需求和对文本结构的理解。查询改写的应用方式是对原始Query拓展出与用户需求关联度高的改写词,多个改写词与用户搜索词一起做检索,从而用更好的表述,帮用户搜到更多符合要求的文本。
2024-01-29 21:31:21 503
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人