最近,导师交给了我们一个任务,让我们核查各个学校提交上来的资料是否正确,我分到的任务就是核查所提交上来的已被收录的论文是否能在相应的期刊搜索的到,以及其他相关信息是否正确。于是,我就想着使用python爬虫帮我自动化完成这些任务。
所使用的网站是:IEEE
网站首页截图是:
我的第一想法就是使用咱们前一篇博客爬取hupu论坛帖子数据的方法,来进行这次的任务。python爬虫爬取虎扑湖人论坛专区帖子数据,并存入MongoDB数据库中
我们来搜索一篇论文,该论文的题目是【Single-Stage Bidirectional Buck–Boost Inverters Using a Single Inductor and Eliminating the Common-Mode Leakage Current】,好,我们将论文题目输入到搜索框中,点击搜索:
这篇论文就是我们需要的。
这时候,我们发现,此时网址的地址为
https://ieeexplore.ieee.org/search/searchresult.jsp?newsearch=true&queryText=Single-Stage%20Bidirectional%20Buck%E2%80%93Boost%20Inverters%20Using%20a%20Single%20Inductor%20and%20Eliminating%20the%20Common-Mode%20Leakage%20Current
有点长,我们进行拆分
https://ieeexplore.ieee.org/search/searchresult.jsp?
newsearch=true
&queryText=Single-Stage%20Bidirectional%20Buck%E2%80%93Boost%20Inverters%20Using%20a%