python 信息检索,python信息检索代码_信息检索_倒排记录表合并算法实现(python)...

小程序描述:输入两个倒排记录表,求两个倒排记录表的交集。

倒排记录表合并算法伪代码如下所示:

22925

功能描述:

①运行程序,看到提示“请输入词项word1:”,输入某个倒排记录表的词项。

②运行程序,看到提示“请输入word1的倒排记录表(输入-1,停止输入倒排记录表):”时,输入①步骤词项的倒排记录表,当输入-1时停止输入此倒排记录表。

③运行程序,看到提示“请输入词项word2:”,输入某个倒排记录表的词项。

④运行程序,看到提示“请输入word2的倒排记录表(输入-1,停止输入倒排记录表):”时,输入③步骤词项的倒排记录表,当输入-1时停止输入此倒排记录表。

小程序功能架构图如下所示:

'''程序说明:

求两个倒排记录表的交集

输入词项的倒排记录表时,当输入-1,停止输入其倒排记录表

'''

#data字典存储所有数据

data = {}

#分别输入两个词项以及其对应的倒排记录表

#输入词项word1以及它的倒排记录表

word1 = str(input("请输入词项word1:"))

id_1 = []

while 1:

a1 = int(input('请输入word1的倒排记录表(输入-1,停止输入倒排记录表):'))

if(a1 != -1):

id_1.append(a1)

else:

break

data[word1] = id_1

#输入词项word2以及它的倒排记录表

word2 = str(input('请输入词项word2:'))

id_2 = []

while 1:

a2 = int(input("请输入word2的倒排记录表(输入-1,停止输入倒排记录表):"))

if(a2 != -1):

id_2.append(a2)

else:

break

data[word2] = id_2

print('词项a1为:',word1)

print('词项a2为:',word2)

print('词项a1的倒排记录表为:',data[word1])

print('词项a2的倒排记录表为:',data[word2])

#求两个词项的并集

same_id = []

for i in data[word1]:

if(i in data[word2]):

same_id.append(i)

else:

continue

print("相同的倒排记录表为:",same_id)

Python信息检索是指使用Python编程语言实现信息检索相关的算法和技术。《信息检索导论》是一本经典的信息检索教材,其中介绍了许多信息检索的基本概念、算法和技术。通过使用Python语言实现这些算法和技术,可以更好地理解和应用信息检索的相关知识。 下面是《信息检索导论》部分实验的简要介绍: - 实验一:倒排记录表合并算法实现 倒排记录表信息检索中常用的数据结构,用于存储单词和文档之间的关系。实验一要求实现倒排记录表合并算法,将多个倒排记录表合并成一个。 - 实验二:两个字符串编辑距离的计算方法实现 字符串编辑距离是衡量两个字符串相似度的一种方法。实验二要求实现两种字符串编辑距离的计算方法:莱文斯坦距离和最长公共子序列距离。 - 实验三:可变字节码的编码和解码算法实现 可变字节码是一种压缩算法,可以将文本数据压缩成更小的字节码。实验三要求实现可变字节码的编码和解码算法。 - 实验四:向量相似度的算法实现 向量相似度是信息检索中常用的相似度计算方法,用于衡量两个向量之间的相似程度。实验四要求实现余弦相似度和欧几里得距离两种向量相似度的计算方法。 - 实验五:利用SIMNOMERGE余弦相似度计算文档得分的算法实现 SIMNOMERGE是一种基于余弦相似度的文档得分计算方法。实验五要求实现SIMNOMERGE算法,计算文档之间的相似度和得分。 - 实验六:NB算法的训练及分类过程实现 朴素贝叶斯算法是一种常用的文本分类算法。实验六要求实现朴素贝叶斯算法的训练和分类过程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值