- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 [学习]简易搜索引擎的制作
bilibili视频:尝试使用python模拟搜索引擎工作原理,做一个简单的搜索引擎搜索引擎原理简单的来解释通过检索输入信息中的索引来返回索引对应的信息,所以主要的算法有两个:一是检索信息中是否存在索引,二是索引对应数据库中的信息。检索信息中是否存在索引博主是选择的直接扫描输入信息中是否包含索引库中的索引,非常简单暴力的方法。import list1 #list1指索引库keywords = input() if key not in list1():
2021-08-22 18:35:21 4097 1
用python实现TF-IDF算法
包括将txt文件的每个字录入并计算出现次数和计算权重的函数,语料库是大约十万字的66篇论文,tfidf.py中是对文章向量化处理和计算夹角的函数,可以用于文章的分类和论文的查重,由于语料库很少,所以可能结果精度不高。
2022-10-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人