倒排索引（信息检索-python代码）

最新推荐文章于 2024-07-30 17:23:09 发布

Flameklin

最新推荐文章于 2024-07-30 17:23:09 发布

阅读量533

点赞数 1

文章标签： python 搜索引擎数学建模

本文链接：https://blog.csdn.net/m0_61417342/article/details/131328652

版权

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、介绍
二、实验 1
- 2.实验 2
总结

前言

通过实验理解倒排索引的构建过程；
掌握采用倒排索引做一个简单的搜索引擎，实现对关键字的检索。

提示：以下是本篇文章正文内容，下面案例可供参考

一、介绍

实验1：采用倒排索引做一个用数组模拟文档的简单的搜索引擎；
实验2：改写实验1，实现对文档的倒排索引。

二、实验 1

代码如下（示例）：


docu_set={'d1':'i love shanghai',
          'd2':'i am from shanghai now i study in tongji university',
          'd3':'i am from lanzhou now i study in lanzhou university of science and technolgy',}

all_words=[]
for i in docu_set.values():
    cut=i.split()
    all_words.extend(cut)
    
set_all_words=set(all_words)
print(set_all_words)


#构建倒排索引
invert_index=dict()
for b in set_all_words:
    temp=[]
    for j in docu_set.keys():
        
        field=docu_set[j]
        
        split_field=field.split()
        
        if b in split_field:
            temp.append(j)
    invert_index[b]=temp     
print(invert_index)   

print('全文搜索university：', invert_index['university'])

2.实验 2

代码如下（示例）：


doc_set = {
    'd1': 'i love shanghai',
    'd2': 'i am from shanghai now i study in tongji university',
    'd3': 'i am from lanzhou now i study in lanzhou university of science and technology'
}
# 构建倒排索引
invert_index = {}
for doc_id, doc_content in doc_set.items():
    words = doc_content.split()
    for word in words:
        if word not in invert_index:
            invert_index[word] = []
        invert_index[word].append(doc_id)
# 搜索
query = 'university'
if query in invert_index:
    result = invert_index[query]
    print('包含查询词的文档：', result)
else:
    print('没有包含查询词的文档。')

总结

在这里插入图片描述

Flameklin

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
倒排索引（信息检索-python代码）

通过实验理解倒排索引的构建过程；掌握采用倒排索引做一个简单的搜索引擎，实现对关键字的检索。提示：以下是本篇文章正文内容，下面案例可供参考实验1：采用倒排索引做一个用数组模拟文档的简单的搜索引擎；实验2：改写实验1，实现对文档的倒排索引。
复制链接

扫一扫