全文检索 - 1、技术选型和架构设计

1. 相关概念

  • 全文检索
    一种将文件中或者数据库中所有文本与检索项匹配的文字资料检索方法,对全文数据的检索。

  • Lucene
    Lucene 是一个 JAVA 搜索类库,它本身并不是一个完整的解决方案,需要额外的开发工作。

  • Elasticsearch
    ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,是最受欢迎的企业搜索引擎。

  • Solr
    Solr是Apache Lucene项目的开源企业搜索平台。其主要功能包括全文检索、命中标示、分面搜索、动态聚类、数据库集成,以及富文本(如Word、PDF)的处理。Solr是高度可扩展的,并提供了分布式搜索和索引复制。

2. 背景

1.大数据背景下数据量的积累与数据应用疲软矛盾一直存在,传统企业的数据存储存在以下问题:
问题1:由于模型受限,传统企业的数据大多存储在关系型数据库mysql、Oracle,非结构化数据存储在MongoDB中。数据量也能积累到TB甚至PB级。
只能进行结构化的检索类似“ select * from table where col like ‘%xxx%’ ”显然不能满足纷繁复杂的业务需求。
问题2:数据是死数据,数据的BI可视化展示需要专业团队开发,但不能得到很好的分析效果。
以上问题形成了数据量累计到

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,下面是字典变位数检索系统的概要设计: 1. 系统架构 字典变位数检索系统采用B/S架构,即浏览器/服务器架构。服务端采用Java语言进行开发,采用Spring Boot框架进行搭建,用于提供RESTful API服务。数据库采用MySQL进行存储,采用Redis作为缓存服务。 2. 功能模块 (1)用户管理模块:用于管理系统的用户,包括用户的登录、注册、修改密码等操作。 (2)字典管理模块:用于管理系统中的字典,包括字典的添加、删除、修改和查询等操作。 (3)检索管理模块:用于管理系统中的检索任务,包括检索任务的创建、编辑、删除和查询等操作。 (4)检索执行模块:用于实现具体的检索功能,包括将输入的字符串转化为不同排列组合的形式,并在字典中进行检索。 3. 数据库设计 系统采用MySQL作为数据库,包括以下表: (1)用户表:存储用户的登录信息和个人信息。 (2)字典表:存储系统中的字典信息,包括字典名称、描述、创建人、创建时间等。 (3)检索任务表:存储检索任务的相关信息,包括任务名称、描述、关联的字典、创建人、创建时间等。 (4)检索结果表:存储检索任务的结果信息,包括任务ID、检索结果、创建时间等。 4. 技术选型 (1)后端框架:Spring Boot (2)数据库:MySQL、Redis (3)前端框架:Vue.js (4)Web容器:Tomcat 5. 系统部署 系统采用Docker容器化部署,包括以下步骤: (1)编写Dockerfile文件,定义系统的镜像构建规则。 (2)使用Docker Compose工具,定义系统的容器编排规则。 (3)使用Docker Swarm或Kubernetes等工具,进行容器的部署和管理。 综上所述,字典变位数检索系统的概要设计包括系统架构、功能模块、数据库设计、技术选型和系统部署等方面。在具体实现过程中,需要根据需求进行详细设计和编码实现。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值