信息检索基础

信息检索

1 信息检索基础

1.1 图书

1.2 期刊

  • 定义: 连续性出版物(卷和期)

  • 期刊编号:

    • ISSN号:国际标准连续出版物号,由8位数字组成,中间用“-”相连,例如ISSN1001-8867
    • CN号:国内统一刊号,由报刊登记号(前六位,地区号-序号)和分类号(字母的含义不同)组成,例如CN11-2746/G2
      地区号是期刊的出版社地址
  • 查验验证期刊

    • 国家新闻出版署(国内)
    • 乌利希国际期刊指南 Ulrichsweb(国际)

1.3 核心期刊

某学科(某领域)发表的论文较多、使用率较高的期刊。

1.3.1 核心期刊判断

判断中文期刊是否是核心期刊:

  • 中国核心期刊要目总览(北大)
  • 中国社会科学引文索引CSSCI(南京大学)
  • 中文科技期刊引证报告
  • 中国科技论文统计源报告
  • 中国科技期刊卓越行动计划入选项

判断外文期刊是否是核心期刊:

  • Web of Science:SCIE、SSCI、AHCI CPCI—S(自科)、CPCI-SSH(社科)
  • Ei Village:EI Compendex
    (校图书馆可以开具核心期刊文章证明)

中外文核心期刊的一站式检索:

  • 美国ExLibris查询系统
1.3.2 期刊影响因子JIF(Journal Impact Factor)

影响因子 = 该刊物前两年发表论文在统计当年被引用的总次数 该刊前两年发表的论文总数 影响因子=\frac{该刊物前两年发表论文在统计当年被引用的总次数}{该刊前两年发表的论文总数} 影响因子=该刊前两年发表的论文总数该刊物前两年发表论文在统计当年被引用的总次数

影响因子=(该刊物前两年发表论文在统计当年被引用的总次数)/该刊前两年发表的论文总数
例如:《Science》在2019年出版文献774篇,2020出版811篇,2019年的文章在2021年被引用39656次,2020年文章在2021年被引用61517次。
该期刊在2021年的影响因子为: 39656 + 61517 774 + 811 = 63.832 \frac{39656+61517}{774+811}=63.832 774+81139656+61517=63.832

  • 一个期刊至少被连续收录3年才能计算影响因子。
  • 在同一个学科领域,影响因子越大,期刊质量越高。
  • 学科发展较慢的学科影响因子一般较小。

影响因子查询:
《中国科技期刊引证指标》数据库可以查中文自然科学刊物的影响因子,CNKI和万方的查询结果也可以参考
被sci收录的刊物影响因子可以检索JCR数据库(Journal Citation report-WoS)

1.3.3 期刊分区
  • JCR分区

将某个学科的所有期刊按照同一年的影响因子降序排列,然后四等分分为Q1、Q2、Q3、Q4(各分区数量相同)

  • 中科院CJCR分区

在JCR分区的基础上,选择学术影响力作为划分方式,把每个学科的所有期刊按照学术影响力(3年平均IF)降序排列,依次划分为ABCD区,其中每个分区的期刊影响力总和相同。
可检索中国科学院文献情报中心期刊分区表
A区的含金量比Q1区的更高。

国家科技图书文献中心(国家科技数字图书馆)
开放论文获取 GoOA

1.4 报纸

定义:以刊载新闻和评论为主的出版周期较短的定期连续出版物
**特点:**信息量大、传递快、传播面广、现实感强

CNKI《中国重要报纸全文数据库》
ProQuest 数据库

1.5 会议文献

定义:在各种学术会议上宣讲和交流的学术论文
特点:新颖性(内容新颖、出版及时)、专深性(专业性和针对性强)、多样性(没有固定出版形式 会议论文集·丛书·科技报告)、 连续性(随会议召开而连续出版)
类型

  • 会前文献:会议论文摘要等
  • 会中文献:开幕词、讨论记录和闭幕词等
  • 会后文献:会后整理出版的文献,如会议录、会议论文集、会议论文汇编等

会议文献著录
论文题名、著者、编者、会议论文集名称、会议地、会议年月日、论文起止编号、会议论文编号

查找会议论文
CNKI、万方、中国国家科技图书文献中心(NSTL)的会议数据库、IEEE、CPCI—S、CPCI-SSH、Ei、ProQuest、SPIE(国际光学工程学会,有演示文稿和视频)

查找会议

  • 中国知网—-中国学术会议信息
  • 科学网—-会议
  • 中科院国际会议服务平台
  • IEEE

1.6 学位论文(Thesis,Dissertation)

**定义:**高等学校和机构为取得某种学位,在导师指导下撰写并提交的学术论文
特点:学术性强、内容系统和完整、不公开发表(保密性)

学位论文收藏单位:
国家图书馆、中国科技信息研究所(自科)、中国科学院图书馆(社科)
美国国会图书馆制定Proquest公司收藏
英国国家图书馆(不列颠图书馆)
日本国立大学 学位授予单位的图书馆

学位论文著录: 大学、年份

学位论文库:

  • 大陆地区:CNKI学位论文库(博士和优秀硕士学位论文)
    万方数据库
    中国国家科技图书文献中心(NSTL)
  • 台湾地区:华艺学术文献数据库 http://etds.ncl.end.tw ndltd
  • 香港地区:香港大学学术库
    香港浸会大学学术库(提供了其他大学的学位论文资源)
  • 澳门地区:澳门大学博硕士论文库

国外:

  • proquest博硕士论文全文数据库(不一定有全文)
  • 国外学位论文中国集团全文检索平台
  • 欧洲支持开放存储平台
  • NDLTD学位论文库(美国国家自然科学基金支持的共建共享平台)->文摘信息
  • OATD(OPEN Access …)

1.7 专利文献

实现专利制度的国家才有专利文献
专利说明书(专利文献核心)、专利公报、专利分类表

  • 特点: 内容新颖、出版迅速;设计技术领域广泛、实用性强;具有法律效力;地域性强、重复量大(向某国申请才受某国法律保护)

  • 特性: 新颖性、创造性、实用性

  • 现代专利制度: 以技术的公开换取法律的保护
    我国1985年4月1日颁布《专利法》
    专利文献包含了世界90%的研发成果

  • 我国专利类型:

    在这里插入图片描述
    美国:实用专利 植物专利 外观设计专利
    不授予专利的类型:可以造福人类的、违法法律法规的

  • 专利编号:
    申请号:10~12位 申请年份 专利类型代号 顺序号 计算机校验码
    在这里插入图片描述
    公告号:国别代码 类型代码 法律状态
    CN110349682A

在这里插入图片描述

在这里插入图片描述

注:英国的专利也是GB

中国专利文献检索:

  • 国家知识产权局
  • 中国专利信息网
  • 中国知识产权网
  • CNKI专利数据库
  • 万方数据资源系统专利数据库
    外国专利文献检索:
  • 欧洲专利局
  • 韩国专利数据库网站(汽车)
  • 德温特(Derwent innovation index)世界专利创新索引- web of science
  • Soopat专利搜索引擎

1.8 标准

由主管机构批准 共同遵守的规定
特点: 制定有一定程序;法律效应与约束力;时效性;每件标准的诗意哦那个范围明确和专一;由权威机构制定,大家共同遵守。

标准文献的分类

  • 国际标准:‘ISO’国际标准化组织 ‘IEC’国际电工委员会
  • 地区标准:欧共体标准’CEN’
  • 国家标准:中国‘GB’ 美国’ANSI’
  • 行业标准:美国机械工程师标准 ‘ASME’
  • 企业标准

国标类型与识别:
GB:强制性国家标准(法律属性)
GB/T:非强制性国家标准
行业标准:行业标准号:代码+标准顺序号+年份
地方标准:地方标准代号+顺序号+年份
企业标准:Q/企业代号+标准号+年份

标准类型与识别:
代号+标准号

中国标准文献检索

  • 国家标准化管理委员会-全国标准信息公共服务平台
  • 中国标准在线服务网
  • 中国标准信息网
  • 中国标准服务网
  • 万方数据知识服务平台标准数据库

1.9 科技报告

科技报告是科学研究和开发调查工作成果的总结或某一阶段进展状况的实际记录。
特点: 内容新颖详细、专业性强、出版及时、传递信息块、发行范围控制严格,不易获取原文

美国政府四大报告:

  • PB报告:美国国家技术信息服务处‘NTIS’出版的报告 民用工程领域
  • AD报告:美国国防技术信息中心’DTIC‘ 军事工程技术
  • NASA报告:美国国家航空宇航局
  • DE报告:美国能源部

识别科技报告: 报告名称+报告号
科技报告检索

  • 国家科技报告服务系统:重大专项计划
  • 中外科技报告数据库
  • ProQuest、万方、CNKI:只有文摘信息

1.10 政府及国际组织的出版物

分类:

  • 行政性文献
  • 科技文献
    特点:内容范围广泛、具有权威性

1.11 产品资料

厂商为推销产品而引发的介绍产品情况的文献,包括说明书等
特点:技术较为成熟、数据较为可靠

1.12 ⭐️文献类型的识别与著录标准

GB/T 7714-2015 信息与文献 参考文献著录规则
图书:[M] 出版社和出版地
期刊:[J] 刊名和卷期
会议:[C] 会议名称和会议论文集名称
学位论文:[D] 学位授予单位
专利:[P] 专利号
在这里插入图片描述

2 信息检索方法

2.1 信息检索概念及类型

概念:
将信息按照一定方式组织和存储,并根据用户需求进行检索的过程。

类型:
(依据检索对象不同)

  • 数据检索:检索的结果是数据;
  • 事实检索:检索结果是事实结论;
  • 文献检索:检索结果是文献资料(最基本、最主要的形式)

2.2 信息检索方法

2.2.1 分析课题

(1)弄清楚课题学科属性、专业范围等相关内容
(2)考虑课题信息的类型
(3)弄清检索课题的时间要求
学科发展较快的,检索的时间段可以适当缩短
(4)明确检索者自身的信息需求

2.2.2 选择检索工具

检索工具是人们用来存储、报道和查找各类信息的工具。(搜索引擎、数据库)
在这里插入图片描述

按著录信息的特征划分

  • 索引型检索工具(主题索引、分类索引、关键词索引、引文索引)
  • 目录型检索工具(馆藏目录、出版社目录、国家书目、联合目录)
    联合目录:CALIS 高等教育文献保障系统;OCLC联机计算机图书馆
  • 文摘型检索工具
  • 全文型检索工具

检索工具的选择方式:

  • 考虑学科范围、信息类型和数据量
  • 了解收录的文献类型
  • 考虑信息的时间范围
2.2.3 确定检索词

“切-删-增”确定检索词

  • 切分:对课题的语句以词为单位进行切分,转换为检索的最小单元
  • 删除:对不具有检索意思的虚词或过于虚泛的限定词予以删除
  • 替换:对表述不清晰、容易产生歧义的词用更加清楚
  • 增加:增加同义词、近义词等相关检索词
    例:万方的智能拓展
    上位词、下位词、相关词
    停用词:“的地得”、‘aabout“等介词冠词
    注意:
    在这里插入图片描述
2.2.4 检索运算符

在这里插入图片描述

布尔逻辑运算符:与或非

  • 与 and:两个检索词同时出“我(空格)你”
  • 非 “电视台(空格)(-)中国”

位置检索算符:“邻接算符”

  • W(with) W0 PRE
    表示两个检索词前后次序固定,两者之间只能间隔连字符、空格或者逗号
  • Wn(With n) W2 W3
    表示两个检索词前后次序固定,检索词之间最多n个字符
  • N(Near)
    -表示两个检索词可以互换顺序,两者之间只能间隔连字符、空格和逗号
  • Nn(Near n)
    表示检索词可以互换顺序,两者之间最多n个字符

A and b的检索结果更多

截词检索算符
截词运算符 通配符 利用检索词词干或不完整词形检索,用于检索一组概念相关的词。
目的:提高查全率,简化输入
截词符:*?$(因数据库而异)
分类:

  • 有限截词:一个符号代表一个字符“?”代表0~1歌字符

  • 无限截词:一个字符可表示任意多个字符,“”代表0~n个字符
    例如:comput

    中文数据库:*表示与操作 外文不一定

  • 后截断 前方一致性

  • 前截断 后方一致性 *out
    color与colour colo?r
    *ology

字段限制检索
在这里插入图片描述

2.2.5 选择检索途径

(1)图书馆分类法

  • 《中国图书馆分类法》:分为5类:马列主义、毛泽东思想;哲学;社会科学;自然科学;综合性图书 22个基本大类
    在这里插入图片描述

T工业技术的戏份:“TB”采用两个字母

类号:B-61《哲学辞典》 -61表示辞典
检索游记小说 I267.4

(2)专利分类法
国际专利分类法(IPC):适用于发明和实用新型专利的分类
在这里插入图片描述

专利使用分类号比较容易检索到

CPC联合专利分类:欧专局和美国专利商标局

(3)标准文献分类法
中国:混合标记:字母表示类号,双位制数字表示等级列位

分类途径的特点:

  • 适合族性检索,查全率高;不适合特性检索,查准率低(与主题途径相反)
  • 不能适应学科发展中的变化,难以反映新学科和新名词术语

①责任者、机构、刊名途径:
英文版著者索引中人名规则

  • 按作者投稿时使用名姓著录
  • 按姓、名次序著录:姓,名
    例子: Abby B.Smith 著录为Smith,Abby B
    姓氏一般为全称,名则以简写居多

翻译为英文的中国机构、著者姓名(音译或者意译)
例如:杨振宁 “Yang Zhenning” “CN Yang” 台湾和香港著录拼音与大陆不同 “Li””Lee”
例如:原西南师范大学在欧专局有4种拼写形式
有些数据库常将University缩写为Univ,使用截词算符“*”

刊名检索:
全称或者缩略语:
“IEEE TRANSACTIONS ON SYSTEMS MAN AND CYBERNETICS”——>“IEEE T Syst Man cyb”

例题1:检索作者“金长青”的论文:
Jin ChangQing
Jin,ChangQing
Jin CQ
CQ Jin

例题2:检索清华大学经济管理学院的李稻葵检索在ssci发表的文章
Web of science核心合集->Social Sciences citation index
作者:(姓名的全称或者简称)li daokui or li dk
地址:tsinghua univ* (二级单位不确定就先不写)

作者投稿名字是li David d 去官网看作者的介绍,看他的投稿刊物名称

使用Wu,Yilong容易漏检 Wu,YL会产生误检

学者ID: 学术身份证 唯一性的标识符 作者标识符
ORCID、Research ID(Wos)、Scopus ID
作用:消除姓名歧义、精确论文归属

②号码途径

在这里插入图片描述

确定检索途径
相同的检索词在不同的字段检索的结果不同
分类途径的检索条目是最多的(提高查全率),标题字段的检索是最少的(提高查准率)

尽量使用文献的外部特征进行检索;外部特征未知可采用内容特征进行检索

2.2.6 拟定检索式

(同义词or 近义词) and ( or )

在这里插入图片描述

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值