信息检索的基本知识:
文献类型:
加工程度:
- 零次文献:未正式发表或未形成正规载体,如书信,手稿,会议记录,笔记
- 一次文献:以本人研究成果为基本素材:论文,期刊,专利,科技报告 ---自己研究的数据
- 二次文献:文献工作者对一次文献加工,提炼,和压缩衣所得:书目,索引,文摘,题录,全文检索 ---把研究的数据分门别类
- 三次文献:利用二次信息的基础上,选用一次信息的内容,根据一定的需要从新组合得到信息:专题评述,年度总结,百科全书,数据手册,年鉴,文献指南 ---把数据分类+展现内容
从检索角度来看:一次文献是检索的对象,二次文献是检索的工具(手段),三次文献是情报研究的成果(检索目标+检索搜段)
信息检索的定义:
广义上:信息按一定的方式进行加工整理,组织并存储起来,再根据信息用户特定非需要将相关信息准确的查找出来
狭义:信息查询,用户根据需要,采用某种方法,借助检索工具,从信息集合中找出所需要的信息
信息检索的分类:
一.检索技术手段分类
1.手工检索:利用图书,期刊,目录卡片等工具来检索
优点:追激性好,没有时间限制,不收费
缺点:费时,低效率,回溯性不好
2.机械检索:利用计算机检索数据库的过程
优点:速度快,回溯性好 缺点:有时间限制
- 检索对象分类:
- 文献检索 ---知网找文献
- 数据检索 ---查询新生婴儿人数
- 事实检索 ---找谁的新歌,找李佳琪崩盘的瓜
- 检索途径不同:
- 直接检索:直接阅读一次文献和三次文献获取信息
- 间接检索 借助检索工具或利用二次文献找文献资料
四.文献信息检索的方法:
1.顺查法:按时间顺序由过去到现在去查找信息,围绕一定的目标去检索一定时间的全部信息
2.倒查法(逆查法,追溯法):从现在的时间段查到过去,注重信息的时效性,新兴学科,知识更新快的学科
3.追溯法:根据原始文献所附的参考文献,脚注等信息进一步查找
信息检索技术:
- 布尔逻辑检索:检索词 and(*)/or(+)/not(-) 检索词--为了提高查准率(少而精)
- and(*)可以缩小检索范围,提高查准率
- or(+) 扩大检索范围,提高查全率
- not(-) 缩小命中范围,提高查准率
- 使用检索词进行信息检索是为了提高查准率
注:百度的“与”不是使用*
- 位置检索:也称临近检索,指使用一些特定的位置算符来表达检索词之前的顺序和词间距
W运算符:除了空格和标点符号以外,不能插入其他词,词序不可以颠倒
nW运算符:词序不可颠倒,检索词之间可以插入最多N个其他词
大数据2W技术 表示大数据和技术可以添加0-2个词
N运算符:除了空格和标点符号以外,不能插入其他词,词序可以颠倒
nN运算符:两个检索词之间可以添加最多N个词,包括实词,系统禁用词
W,N的主要区别:检索词出现的位置是否可以颠倒
F,S运算符:适用更加复杂的场景
- 截词检索:提高查全率的检索技术,(有限截词)?,*(有限截词),$
前截断:*ware ,可以检索出software,hardware
后截断 recon* ,reconvene
中截断:m?n ,men,man
- 字段限制检索:指计算机检索时,将检索访问限定在数据库特定的字段中,常用的检索字段有:标题,摘要,关键词,作者,单位......
两种检索字段的形式:
1.后缀方式:字段/TI(篇名) /AB(文摘)
information/TI 表示仅在篇名字段中检索information的信息
2.前缀方式:AU=(作者)、ISBN=(ISBN号)
搜索引擎:
1.定义:根据一定的策略,运用特定的程序从计算机搜集信息,对信息处理后进行呈现----爬虫。包括三个部分:信息搜索,信息整理,用户查询
最基本功能:搜索信息的及时性,有效性,针对性
2.分类:
1.全文搜索引擎:百度,360,谷歌,必应。指把互联网上的数据爬取到自己的数据库,让用户从自己的数据库查找信息
2.目录式搜索引擎:新浪,网易,搜狐,雅虎。指人工或半自动方式收集信息,把信息摘要整理成目录形式
3.元搜索引擎:搜星搜索引擎。 指通过一个统一的界面,同时在多个搜索引擎上搜索并将结果返回给用户
3.指令:
1.site指令:可以查询到某个域名被该搜索引擎收录收录的页面数量
site:网址域名 如,site:ptpress.com.cn 或site:www.ptpress.com.cn
2.inurl指令:可以查询到url中包含指定文本的页面数量
inurl:指定文本 关键字 如,inurl:download 虎牙app
3.intitle/title指令:可以查询到在页面标题中包含指定关键字的页面数量
intitle:网络接口 CCNP 可以筛选出同时有网络接口,ccnp的页面标题
- filetype指令:获取指定类型文件
“放假” Filetype:xls 获取放假内容的相关表格
扫盲:
- 知乎不是搜索引擎,知乎是中国互联网最大的知识社交平台,中文问答网站
- 百度是搜索引擎(全球最大的中文搜索引擎),百度知道:全球最大的中文问答平台
- 常见搜索引擎:
专利文献,论文 --CNKI,中国知识产权网,万方数据库知识服务平台
综合性期刊 ---维普网
电子图书 ---超星数字图书馆,读秀
4.中国知网:(全称中国国家知识基础设施资源系统,CNKI)
CNKI的检索字段有:篇名字段,作者,关键词,主题,ISSN(国际刊号),期数,年份,基金,全文,引文,刊名,摘要...
文献提供两种下载格式:CAJ格式--CAJview软件
PDF格式--
想要查找专门的信息,可以去找专门的信息平台。专用平台会提供检索工具帮助更方便,准确的检索所需要的信息。没有检索工具,就慢慢搜