![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
倒排索引
文章平均质量分 88
我的一个项目记录一下
学不会只能哭
要毕业了,希望大佬们捞一下www,写的文章就是用来做笔记的,比较随意。有内推的大佬可以帮帮我吗?我的邮箱是tony54856476@163.com
展开
-
基于luncene倒排索引实现大规模数据集检索优化(一)基础知识篇
原理探索(基础知识)检索在一组记录集合中找到关键码值等于给定值的某个记录,或者找到关键码值符合特定条件的某些记录的过程 (key,value)检索效率非常重要尤其对于大数据量需要对数据精选特殊的存储处理提高检索效率的方法1)预排序排序算法本身比较费时只是预处理(在检索之前已经完成)2)建立索引检索式重复利用辅助索引信息,以空间换时间牺牲一定的空间从而提高检索效率3)散列技术把数据组织到一个表中更具关键码的值确定表中记录的位置缺点1: 不适合进行范围查询。原创 2023-02-22 01:06:20 · 3086 阅读 · 0 评论 -
基于lunence倒排索引技术实现大规模检索的优化(二)Luncene 技术原理讲解
Lucene 是一种用 Java 编写的高性能全文搜索引擎库。它提供了丰富的搜索和索引功能,支持多种语言,包括中文,常用于构建企业级搜索系统。Lucene 的基本特点包括:支持多种语言:Lucene 支持多种语言的文本索引和搜索,包括英语、中文、日语等,可以方便地构建多语言搜索系统。高性能:Lucene 的搜索速度非常快,可以处理大规模的文本数据。它采用了倒排索引的方法,将索引数据存储在内存中,从而提高搜索效率。原创 2023-02-22 01:08:59 · 3085 阅读 · 0 评论