问答系统中如何进行过滤来降低时间复杂度:核心思路是层次过滤,先用复杂度低的模型过滤掉大部分语料库中的问答。然后用复杂度高的过滤器(如计算夹角余弦相似度)进行精确计算排序。
即
倒排表: 把语料库里的每个词都建一个列表,语料库里的文档包含该词的都放到一块。然后再看输入的问题含有的词语。有该词的文档都写出来,然后进行过滤。常用于搜索系统
问答系统中如何进行过滤来降低时间复杂度:核心思路是层次过滤,先用复杂度低的模型过滤掉大部分语料库中的问答。然后用复杂度高的过滤器(如计算夹角余弦相似度)进行精确计算排序。
即
倒排表: 把语料库里的每个词都建一个列表,语料库里的文档包含该词的都放到一块。然后再看输入的问题含有的词语。有该词的文档都写出来,然后进行过滤。常用于搜索系统