NLP
文章平均质量分 93
会唱歌的猪233
菜鸡菜鸡
展开
-
huggingface中Bert模型的简单使用
huggingface的Bert模型的简单使用,内含有BertConfig,BertTokenizer,BertModel的使用原创 2022-08-01 22:30:13 · 5972 阅读 · 1 评论 -
关于BM25
相对完整的介绍了在IR领域重要的相关性打分算法BM25.后续如果有更深的体会也会进行更新.BM25算法公式由三个主要的模块构成–词在文档中的相关度,词在查询关键字中的相关度以及词的权重(IDF).BM25算法是一个长期积累的经验公式,是一个简单高效基础基于词袋的无监督的learning-to-rank的算法,但是并没有考虑词之间的相关性,是在词的基础上进行统计计算,没有深入到语义层面....原创 2022-03-04 17:25:51 · 1234 阅读 · 0 评论