wos是web of science的简称,即科技文献数据库。国际公认的反映科学研究水准的数据库,其中以SCIE、SSCI等引文索引数据库,JCR期刊引证报告和ESI基本科学指标为主。
本文采集策略失效了,新版wos上线 2021/07/13
可查看《新版详情页采集案例》
wos采集方法:
- 通过三方平台提供的入口进行模拟登录
- 登录后获取搜索接口需要的用户身份认证参数SID。
- 根据关键词生成searchID后进行数据检索。
一些三方平台像80图书馆,从入口登录后可以获取到SID。
找到这个post接口:https://apps.webofknowledge.com/UA_GeneralSearch.do
获取location >> 302重定向的链接
通过该链接进行列表页的采集即可