计算机信息检索 02139

@计算机信息检索

名词解释

1、浏览器
指web服务端的浏览程序,是显示网页或档案的文件,用户能与之互动的一种软件

2、传记资料
记录历史人物或当代著名人物的生平资料等相关信息

3、元数据
是描述数据的数据,也叫电子目录,元数据用来揭示各类型电子文档的内容和其他特征的工具

4、参考信息
是指人名,地名,机构,事件,统计数据等一类的数据,事实信息,是人们在工作研究和日常生活中经常要查考和引用的信息

5、主页
浏览器访问某个web服务器上的信息时,第一个链接到的文档

6、telnet资源
是指借助远程登录网络通信协议Telnet的支持,在远程计算机上登录,使自己的计算机成为远程计算机的终端,进而可以实时访问,使用远程计算机对外开放的软硬件资源

7、信息查询
通过搜索,定位以及取得数据的过程,也就是说从大量数据集合中获取用户需要的相关信息

8、年鉴
每年出版的统计数据和事实的汇编,兼有现期性和回溯性内容,其包含的地区和学科领域一般比较广泛,也可能限于某一特定的国家或特定的领域

9、链接
链接是web网页的元素,是指向其他信息资源的指针,它把web网页捆绑在一起,跟随链接可以从一个文档跳转到另一个文档

10、用户组信息资源
包含用户新闻组,邮件群,曾经是互联网上很流行的信息交流方式,包含新闻组,电子邮件群,兴趣组,论坛等,实质上是有一组对某一特定主题事物有共同兴趣的网络用户组成的邮件群组或电子论坛

11、信息组织
把数据按照一定的结构,顺序,排列方式组织起来,或者说是按照信息查询的需要,对数据根据其特征进行组织

12、词典
根据一定的编撰目的的汇集词语,并加以描述,说明,按照字顺排序,供人们查找词语信息的工具书

13、搜索引擎
是一种能够通过互联网接收用户的查询指令,帮助用户迅速的从网上查找到所需要的信息,并向用户提供符合其查询结果的搜索结果列表的检索系统

14、学位论文
是指高等院校或学术研究机构的学生为获得某种学位而撰写的科学论文,包含学士论文,硕士论文,博士论文

15、国际组织
是指具有国际性行为特征的组织,是3个或3个以上国家,为实现共同政治经济目的,依照条约或正式法律文件建立的一点规则知道的常设性机构

16、白页
专用于查询个人信息的特殊工具,个人信息包含,电话号码,e-mail地址,邮编,住址等

17、超文本传输协议
是指浏览器与web服务器之间的相互通信,传输,响应用户请求的协议

18、元搜索引擎
又称为集合式搜索引擎,并行搜索引擎或搜索引擎之搜索引擎,是将多个搜索因为集成在一起,并提供一个统一的检索界面

19、会议文献
学术会议是科学工作者进行学术交流的重要场所,会议文献是在学术会议上所发表的论文,报告,演讲等的统称

20、网络资源目录
是以整个互联网资源为检索对象,将一些重要,优质的互联网资源组织成分类目录,提供给用户检索

21、黄页
是国际上通用的按企业性质和产品类别编排的工商电话号码薄,相当于一个城市或地区的工商企业的户口薄,包含相关企业地址,产品和经营等相关信息

22、超文本标记语言
HTML是一种专门编程语言,具体规定和描述了文件显示的具体格式

23、目录型检索工具
一般采用人工或半人工的方式采集和存储网络信息,由专业人员对网络资源进行调查和搜集,并遵循某种分类体系进行分类,存储和组织

24、标准
按照规定的程序制定,经公认权威机构或主管机关批准的,一整套在特定领域内必须执行的规格,规则,技术要求等规范性文献

25、机构目录
又称名录,指南,行名录等,是用来查询机构团体相关信息的一系列检索工具

26、图像检索
通过图像的文本表示或视觉特征,为用户提供互联网上相关图像资源检索服务的专业搜索引擎系统

27、垂直搜索引擎
针对某一领域,某一特定人群或某一特定需求提供的信息检索及相关服务,特定是专,精,深,且具有行业色彩

简答题
1、CBIR 的特点

  • 直接从图像中提取语义线索和特征,根据这些线索从大量存储在数据库中的图像中查找,检索出具有相似特征的图像数据,可使检索过程更加有效,适用性更强
  • 与相似匹配similarity代替精准匹配match方式
  • 提问方式直观,检索交互性强
  • 多层次的高效率检索

2、因特网上的主要信息内容分类

  • 政府信息
  • 科研信息
  • 教育信息
  • 媒体信息
  • 商务信息
  • 休闲娱乐信息

3、信息检索工具性能评价的主要内容

  • 收录范围 每种互联网检索工具都有相应的收录对象及收录原则,方针,选择某种检索工具的时候需要先链接其收录数据的性能
  • 检索功能 功能会直接影响检索工具的检全率,检准率,检索的灵活性、方便性以及检索速度,是选择互联网检索工具的核心指标
  • 检索效率
  • 检索结果的处理和展示 直接影响用户的浏览和吸收信息
  • 用户界面设计 是否友好展示,是否易于使用

4、目录型检索工具分类法

  • 主题分类法 特征是一个主题充当一个分类,类目像主题词表一样按字顺序排序,而不是以逻辑顺序排序
  • 学科分类法 一般以知识分类为基础,按照学科的性质及从属、层次关系来组织网络资源
  • 图书分类法
  • 分面组配法

5、目录型检索工具的类型

  • 网络资源目录
  • 学科信息门户
  • 搜索工具门户

6、网络检索技术以什么为核心,在哪些领域
以提高搜索工具的信息服务功能,完善搜索服务为核心

  • 智能搜索
  • 语义搜索
  • 垂直搜索
  • 基于内容的多媒体信息检索
  • 跨语言检索
  • 信息检索可视化

7、网络信息资源评价标准

  • 目的
  • 范围
  • 内容
  • 费用
  • 评论

8、检索工具分类

  • 按照检索对象划分,分为web资源检索工具和非web资源检索工具
  • 按照检索机制划分,分为目录型,索引型和混合型
    Google是索引型,Yahoo是目录型,他们都是混合型
  • 按照检索工具数量划分,分为独立型和集成型

9、进阶检索技巧

  • 猜测URL
  • 右截断网址
  • 利用网络快照
  • 注意多义词
  • 避免拼写错误
  • 利用浏览器的查找功能
  • 利用检索工具的特殊功能
  • 利用辅助关键词
  • 顺藤摸瓜
  • 利用自然语言检索
  • 注意单词大小写
  • 垂直检索
  • 善于利用错误信息
    (答对7个即可)

10、搜索引擎主要的工作步骤如下

  • 抓取 从互联网上抓取网页
  • 索引 建立索引数据库
  • 搜索、排序 在索引数据库中搜索排序
  • 显示 对搜索结果进行处理排序

11、搜索引擎对信息的预加工处理技术主要有

  • 关键字提取技术
  • 垃圾信息消除技术
  • 链接分析术
  • 网页重要性计算技术

12、关键字选取常用步骤

  • 抽取基础关键词,排除常用词
  • 考虑基础关键词的同义词
  • 考虑上位词和下位词
  • 考虑相关词
  • 总结审视

13、互联网信息检索的类型

  • 顺链而行的浏览
  • 基于目录型检索工具的互联网信息检索
  • 基于索引型检索工具的互联网信息检索

14、元搜索与普通搜索的区别

  • 元搜索引擎一次可以提交多个数据库
  • 元搜索没有自己独立的资源库
  • 元搜索引擎的结果是基于独立搜索结果的二次加工
  • 元搜索引擎的搜索结果记录标注其搜索来源以及相关度

15、目录型网络检索工具的特点和使用方法
特点

  • 面向用户的易用性
  • 提供准确性较高的信息内容
  • 提供导航作用良好的检索体系结构
  • 以明确的目的和对象为中心设置确定类目
  • 有兼容性强的多元类目

使用方法

  • 采用广度优先查询法
  • 注意了解各个检索工具的收录特点,选适当的工具
  • 掌握各目录型检索工具的分类体系
  • 关注热门主题和常用目录
  • 关注开放目录型检索工具

16、网上参考信息源的主要类型

  • 百科知识检索网站
  • 人物信息检索网站
  • 地理信息检索网站
  • 时事,新闻检索网站
  • 机构信息检索网站
  • 词语信息检索网站
  • 统计信息检索网站

17、垂直搜索引擎的主要特征和关键技术
特征

  • 在信息采集上,采用主动采集和被动采集相结合的方式
  • 在信息加工上,对网页信息进行结构化信息提取加工
  • 在信息检索上,能够提供结构化与非结构化相结合的方式进行检索
    关键技术-主题爬虫技术、web信息提取技术

18、常用互联网检索模型

  • 布尔检索模型
  • 扩展布尔检索模型
  • 向量空间模型
  • 概率检索模型

19、互联网信息资源的局限性

  • 分散
  • 无序
  • 多变
  • 信息质量难以控制
  • 信息安全难以保障

20、元搜索引擎的优点/缺点
优点

  • 信息覆盖面大,检索效率高
  • 检索工具扩展性强
  • 服务多样化
  • 无需考虑网页索引数据库的建立与维护

缺点

  • 检索结果的全面性和可靠性差
  • 不能灵活控制结果的输出
  • 检索结构排序不够理想
  • 信息搜索覆盖面存在局限性
  • 检索式处理较为复杂

21、图书馆馆藏目录系统的检索途径

  • 题名检索
  • 责任者检索
  • 分类建设
  • 主题/关键词检索
  • 号码检索
  • 出版社名称检索

22、互联网信息检索的特点

  • 无限的检索范围
  • 动态的检索对象
  • 丰富的检索内容
  • 新兴的检索领域
  • 强大的检索工具
  • 低廉的检索费用

23、网络检索工具和网络检索行为面临的法律风险

  • 版权风险
  • 侵犯隐私风险
  • 搜索引擎营销的法律风险
  • 避风港原则

24、互联网信息资源的特点

  • 广泛性
  • 多样性
  • 共享性
  • 新颖性
  • 互动性
  • 经济性

25、搜索引擎的发展趋势

  • 自然语言检索技术
  • 目录导航检索与关键词检索结合
  • 智能化和个性化检索技术
  • 多媒体检索技术
  • 3G移动搜索
  • 交叉语言检索

26、FTP协议的主要功能以及获取文件的步骤
主要功能-完成一个系统到另一个系统文件的拷贝

  • 登录
  • 浏览文件,找到所需文件
  • 设置文件传输参数,选择文件传输模式
  • 下载所需的文件

27、搜索引擎的主要类型和检索领域

  • 元搜索引擎

  • 通用搜索引擎

  • 垂直搜索引擎

  • 综合型网络检索工具

  • 专业型网络检索工具

  • 特性型网络检索工具

28、主题爬虫
主题爬虫是根据一定的网页分析算法过滤与主题无关的链接,保留主题相关的链接并将其放入待抓取的网页URL,重复上述步骤,知道达到某一条件为止

29、网络信息检索服务的发展方向

  • 个性化 包含个性化定制,个性化推荐、个性化信息检索
  • 多样化 包括短信搜索 wap搜索,基于互联网的移动搜索、语音搜索
  • 社会化 针对社交媒体的崛起,增加社会性网络的元素和功能
  • 3
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值