福建专升本-拓展部分信息检索

信息检索的基本知识:

文献类型:

加工程度:

  1. 零次文献:未正式发表或未形成正规载体,如书信手稿,会议记录,笔记
  2. 一次文献:以本人研究成果为基本素材:论文,期刊,专利,科技报告        ---自己研究的数据
  3. 二次文献:文献工作者对一次文献加工,提炼,和压缩衣所得:书目,索引,文摘,题录,全文检索     ---把研究的数据分门别类
  4. 三次文献:利用二次信息的基础上,选用一次信息的内容,根据一定的需要从新组合得到信息:专题评述,年度总结,百科全书,数据手册,年鉴,文献指南   ---把数据分类+展现内容

从检索角度来看:一次文献是检索的对象,二次文献是检索的工具(手段),三次文献是情报研究的成果(检索目标+检索搜段)

信息检索的定义:

广义上:信息按一定的方式进行加工整理,组织并存储起来,再根据信息用户特定非需要将相关信息准确的查找出来

狭义:信息查询,用户根据需要,采用某种方法,借助检索工具,从信息集合中找出所需要的信息

信息检索的分类:

一.检索技术手段分类

1.手工检索:利用图书,期刊,目录卡片等工具来检索

优点:追激性好,没有时间限制,不收费

缺点:费时,低效率,回溯性不好

2.机械检索:利用计算机检索数据库的过程

       优点:速度快,回溯性好    缺点:有时间限制

  • 检索对象分类:
  1. 文献检索      ---知网找文献
  2. 数据检索      ---查询新生婴儿人数
  3. 事实检索      ---找谁的新歌,找李佳琪崩盘的瓜
  • 检索途径不同:
  1. 直接检索:直接阅读一次文献三次文献获取信息
  2. 间接检索  借助检索工具或利用二次文献找文献资料

四.文献信息检索的方法:

1.顺查法:按时间顺序由过去到现在去查找信息,围绕一定的目标去检索一定时间的全部信息

2.倒查法(逆查法,追溯法):从现在的时间段查到过去,注重信息的时效性,新兴学科,知识更新快的学科

3.追溯法:根据原始文献所附的参考文献,脚注等信息进一步查找

信息检索技术:

  1. 布尔逻辑检索:检索词 and(*)/or(+)/not(-) 检索词--为了提高查准率(少而精)
  1. and(*)可以缩小检索范围,提高查准率
  2. or(+) 扩大检索范围,提高查全率
  3. not(-) 缩小命中范围,提高查准率
  4. 使用检索词进行信息检索是为了提高查准率

注:百度的“与”不是使用*

  1. 位置检索:也称临近检索,指使用一些特定的位置算符来表达检索词之前的顺序和词间距

W运算符:除了空格和标点符号以外,不能插入其他词,词序不可以颠倒

nW运算符:词序不可颠倒,检索词之间可以插入最多N个其他词

大数据2W技术    表示大数据和技术可以添加0-2个词

N运算符:除了空格和标点符号以外,不能插入其他词,词序可以颠倒

nN运算符:两个检索词之间可以添加最多N个词,包括实词,系统禁用词

W,N的主要区别:检索词出现的位置是否可以颠倒

F,S运算符:适用更加复杂的场景

  1. 截词检索提高查全率的检索技术,(有限截词)?,*(有限截词),$

前截断:*ware ,可以检索出software,hardware

后截断 recon* ,reconvene   

中截断:m?n  ,men,man

  1. 字段限制检索:指计算机检索时,将检索访问限定在数据库特定的字段中,常用的检索字段有:标题,摘要,关键词,作者,单位......

两种检索字段的形式:

1.后缀方式:字段/TI(篇名) /AB(文摘)  

information/TI 表示仅在篇名字段中检索information的信息

2.前缀方式:AU=(作者)、ISBN=(ISBN号)

搜索引擎:

1.定义:根据一定的策略,运用特定的程序从计算机搜集信息,对信息处理后进行呈现----爬虫。包括三个部分:信息搜索,信息整理,用户查询

 最基本功能:搜索信息的及时性,有效性,针对性

2.分类:

1.全文搜索引擎:百度,360,谷歌,必应。指把互联网上的数据爬取到自己的数据库,让用户从自己的数据库查找信息   

2.目录式搜索引擎:新浪,网易,搜狐,雅虎。指人工或半自动方式收集信息,把信息摘要整理成目录形式

3.元搜索引擎:搜星搜索引擎。 指通过一个统一的界面,同时在多个搜索引擎上搜索并将结果返回给用户

3.指令:

1.site指令:可以查询到某个域名被该搜索引擎收录收录的页面数量

site:网址域名  如,site:ptpress.com.cn    或site:www.ptpress.com.cn

2.inurl指令:可以查询到url中包含指定文本的页面数量

inurl:指定文本 关键字   如,inurl:download 虎牙app

3.intitle/title指令:可以查询到在页面标题中包含指定关键字的页面数量

intitle:网络接口 CCNP  可以筛选出同时有网络接口,ccnp的页面标题

  1. filetype指令:获取指定类型文件

“放假” Filetype:xls    获取放假内容的相关表格

扫盲:

  1. 知乎不是搜索引擎,知乎是中国互联网最大的知识社交平台,中文问答网站
  2. 百度是搜索引擎(全球最大的中文搜索引擎),百度知道:全球最大的中文问答平台
  3. 常见搜索引擎:

 专利文献,论文   --CNKI,中国知识产权网,万方数据库知识服务平台

 综合性期刊       ---维普网

 电子图书         ---超星数字图书馆,读秀

4.中国知网:(全称中国国家知识基础设施资源系统,CNKI)

CNKI的检索字段有:篇名字段,作者,关键词,主题,ISSN(国际刊号),期数,年份,基金,全文,引文,刊名,摘要...

文献提供两种下载格式:CAJ格式--CAJview软件

 PDF格式--

想要查找专门的信息,可以去找专门的信息平台。专用平台会提供检索工具帮助更方便,准确的检索所需要的信息。没有检索工具,就慢慢搜

  • 18
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值