【Python】Web of Science主要内容批量提取。

前言

有的时候需要进行大批量的文献搜索,动则几百篇。但是只在web of science上面一篇一篇读,又很慢。手动copy页面到word里面,也是很低效。因此考虑利用python来对web of science上的文献进行批量搜集。

需求:

在web of science进行文献搜索后,希望把重要信息(如标题、作者、期刊名、日期、摘要)记录下来。

 

步骤:

1. 输入关键词搜索文献

 2. 点击【导出】,然后选择自己想要导出的文献的数目,也就是标号。格式选择【html格式】

 3. 打开html,查看它的源码。可以清楚的看到html的结构,其中【标题】、【作者】、【日期】、【摘要】等信息都包含在每一个<tr>当中,因此用Python可以很好的提取出当中的内容。

例如,AB对应的就是Abstract&#

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值