1、文本相似度 — TF-IDF和BM25算法
https://www.cnblogs.com/jiangxinyang/p/10516302.html
2、隐马尔科夫求解:
隐马尔科夫模型HMM(二)前向后向算法评估观察序列概率 - 刘建平Pinard - 博客园 (cnblogs.com)
3、搜索简单实现
https://github.com/9ayhub/nlp-search-engine
4、Apriori进行关联算法
https://www.cnblogs.com/bigmonkey/p/7405555.html
5、比如潜在语义索引(LSI)
https://www.cnblogs.com/pinard/p/6805861.html
6、命名实体识别
https://zhuanlan.zhihu.com/p/166496466
https://github.com/lonePatient/BERT-NER-Pytorch/blob/master/run_ner_span.py
实体识别新词发现https://blog.csdn.net/demm868/article/details/103053148
https://github.com/mattzheng/LangueOne
7、seq2seq
https://blog.csdn.net/weixin_44388679/article/details/102575223