搜索引擎(一)体系结构 思维导图

      搜索引擎体系结构概述

       思维导图 http://www.xmind.net/share/sndnyangd/search-engine-architecture-1/

          看的是清华大学和百度合作的搜索引擎基础课程的教材《搜索引擎技术基础》,这里写的是第四章——搜索体系结构概述,截图在这儿也放不下,千言万语也不如一张图,所以,就用这种方式来写吧。

       之前,不知道倒排索引是何物,现在终于知道,合拢索引的索引项是词项,而正排索引的是文档,如此而已。

       在CS101写的搜索引擎中,内容索引子系统已经是用词项了,只是不知道这个概念而已。

       照书中所说,搜索引擎主要由数据抓取、内容索引、内容检索、链接结构分析四部分组成。回顾在CS101中,写的那个简易的搜索引擎:

       其中,爬虫是必须有的,也就是CS101中已经用PYTHON写了基础的数据抓取子系统,不过没有提到涉及的各种网络协议,也没有其它的策略。

Oracle数据库是一个复杂的系统,由多个组件和层次构成。它的体系结构通常可以被划分为物理结构、逻辑结构和内存结构三大类。 1. 物理结构: - 数据文件:存储数据库数据的实际文件。 - 控制文件:记录数据库结构和状态的文件。 - 重做日志文件:记录数据库修改历史,用于恢复操作。 - 初始化参数文件:定义数据库的配置参数。 - 归档日志文件:是重做日志文件的备份,在归档模式下使用,用于灾难恢复。 2. 逻辑结构: - 表空间:数据库的最高逻辑层次,由一个或多个数据文件构成。 - 段(Segment):数据库对象如表、索引等在磁盘上的存储单元。 - 区(Extent):段内的一组连续的数据块。 - 数据块(Data Block):Oracle数据库最小的存储单位。 3. 内存结构: - 系统全局区(SGA):包含数据库实例运行时需要的内存区域,如数据库缓冲区、重做日志缓冲区等。 - 程序全局区(PGA):用于单个服务器进程的内存区域,包含排序区、会话信息等。 - 进程结构: - 服务器进程:处理客户端请求的进程。 - 后台进程:维护数据库运行的进程,如数据库写入器(DBWn)、日志写入器(LGWR)等。 这些组件和层次相互作用,共同构成了Oracle数据库的核心体系结构。了解这些结构对于数据库管理员来说是非常重要的,因为它有助于更好地进行数据库的配置、性能调优和故障排除。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值