数据库检索和全文检索的比较(性能,匹配度准确度,相关度排序)

数据库检索:

1(性能):使用like搜索,会对表中的数据进行全表扫描

2(匹配度准确度):select * from table where 字段 like '%关键词%';

3(相关度排序):搜索的时候想要那条结果排在那个位置不能由我们决定,只能通过order by 字段名,字段名.....查询的结果来显示

全文检索:是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时根据建立的索引查找!

1(性能):我们搜索的时候直接根据索引找到对应的数据(我们需要对数据建立索引,但是索引是一次建立,多次使用)

2(匹配度准确度):建立的索引都是文档当中出现了的关键字,不会出现一些不相干的数据

3(相关度排序):lucene为每一条匹配的结果打一个分,得分越高,排列的顺序越靠前


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
近年来,随着信息时代特别是数字时代的来临,计算机信息处理已经成 为卫星云图处理最主要的手段。卫星云图是遥感成像数据中包含信息最多的 数据源之一,采用图像处理方法分析并提取有用图像特征和内容,进而判断 大气变化情况和天气形势,是当前天气预报界的主流工作模式。因此,合理 地处理、分析和应用卫星云图信息,已经成为卫星云图处理的主要研究方向。 本文在借鉴传统图像处理方式的前提下,提出了基于内容的卫星云图处 理和信息检索方法,提高了图像处理的目的性和使用效率,具有较高的创新 价值和实用价值。本文所提出的图像内容的含义包含两层意思:一是纹理、 颜色、形状、边缘等基本图像特征,它们组成了反映图像特点最基本的内容; 二是通过这些特征所反映出的信息,即该图像所描述的天气状况及发展趋势。 在本文中,针对这两层图像内容作了系统的分析,采用了多种图像处理算法 提取图像特征,并进一步分析这些特征所体现出的信息,达到实际应用的目 的。具体地,本文完成的工作和取得的研究成果主要包括以下几个方面: 1.将基于内容处理的思想引入卫星云图处理领域 本文将卫星云图的特征作为研究内容,从底层特征提取和高层图像检索 两个层次研究了卫星云图内容的处理和分析,并将图像理解的范畴引入卫星 云图处理领域,是具有前瞻性的研究课题。 2.针对卫星云图基本特征,提出了识别卫星云图的基本判据 在系统分析大量卫星云图的基础上,提出了卫星云图识别的一般判据, 并从这六大判据依次上升到图像的四项特征(颜色、纹理、边缘、形状),为 准确地进行云图处理和识别奠定了基础。 3.在小波域内系统研究了基于组合滤波思想的卫星云图预处理算法 卫星云图由于其成像机制,遥感图像的分辨率和清晰还有待提高,图 像“软”处理技术在当前硬件水平欠缺的情况下就显得尤为重要。基于小波 域的组合滤波方法将平滑滤波的思想应用于小波分解图像,在小波域内能够 充分滤除干扰,重构后的图像质量取得了明显改善。 4.系统分析了卫星云图的特征,提出了改进的边缘检测融合算法 哈尔滨工程大学博士学位论文 卫星云图的基本特征可以包括光谱特征、纹理特征和空间几何特征三类。 本文从颜色处理和灰校正出发,研究了卫星云图的颜色特征,改善了图像 质量;系统分析了卫星云图的纹理特性,采用具有统计特性的共生矩阵法分 析图像纹理特征参数,实现了卫星云图的特征识别;特别是针对卫星云图的 边缘特征,提出了改进的边缘检测融合算法,该算法基于Sobel算子的强边 缘检测原则和canny算子的最优检测三大准则,取得了较好的改良效果。 5.提出了基于特征矢量空间和全局竞争生长准则的区域生长算法 卫星云图的区域特征提取一直是个难题,常面临“找不准”和“溢出” 等问题,本文改进了常规的区域生长算法,在特征矢量空间表征图像,基于 全局比较探测、面积测定及空间优先、竞争机会均等三个生长准则,采用贴 标签的方式决定特征向量的归属,能够准确的提取目标区域。 6.基于变分方法,提出了两种卫星云图轮廓提取算法 卫星云图的轮廓特征是最重要的一种视觉特征,本文采用变分方法提取 卫星云图轮廓,系统分析了变分理论的两大分支—参数活动轮廓模型和几 何活动轮廓模型的特点,提出了两种轮廓提取算法,能够有效实现卫星云图 真实轮廓的标记。 7.提出了一种适用于卫星云图检索的多特征加权反馈方法 研究了基于内容的卫星云图信息检索特征提取、特征索引、图像匹配、 特征反馈的全过程,从颜色、纹理、形状、轮廓等不同的图像特征内容出发, 研究了根据不同特征进行图像信息检索的方法,提出了一套有效的图像多特 征加权反馈检索方法,能够准确高效地检索相关的图像信息。 本文在分析了大量图像和借鉴传统方法的基础上,针对卫星云图的特征, 提出了几种适合于卫星云图的处理方法,取得了较好的实验效果。由于气象 图像数据量的庞大,为了便于查询分析结果,建立了便利的卫星云图数据库, 研究了基于图像内容的图像检索方法。本课题将卫星云图的处理、分析、入 库、检索、应用及预报的业务过程作为一个整体联系起来,提高了卫星云图 的应用效率,具有较高的理论价值和应用价值。
内容检索、召回和排序算法是信息检索领域中常用的技术,用于从大规模数据中快速找到与用户查询相关的内容,并按照一定的规则进行排序。 1. 内容检索:内容检索是指根据用户查询的关键词或者短语,在数据集中找到所有与之相关的内容。常用的技术包括倒排索引、布尔模型和向量空间模型等。倒排索引是一种以单词为索引项,记录该单词在文档中出现位置的数据结构,可以快速定位包含特定关键词的文档。 2. 召回算法:召回算法是指从大规模数据中筛选出与用户查询相关的内容。常用的召回算法包括基于规则的匹配、TF-IDF、BM25、语义匹配等。基于规则的匹配是根据预先定义的规则,筛选出满足规则条件的内容。TF-IDF(词频-逆文档频率)和BM25(BM25评分函数)是基于词频和文档频率计算查询与文档之间的相关性的算法。语义匹配则是通过计算查询与文档之间的语义相似来进行匹配。 3. 排序算法:排序算法是指根据一定的规则将召回的内容进行排序,以便将最相关的内容排在前面。常用的排序算法包括PageRank、BM25F、LambdaRank等。PageRank是一种基于图的排序算法,通过计算网页之间的链接关系来确定网页的权重。BM25F是对BM25算法的扩展,考虑了不同字段对查询的贡献。LambdaRank是一种机器学习算法,通过训练排序模型来优化排序结果。 这些算法通常会结合使用,以实现更准确和高效的内容检索、召回和排序

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值