背景
笔者是VSLAM领域,虽然VSLAM领域也属于CV领域的,但却远没有CV三大顶会那么火热。虽然咱也有论文的list,但却没有批量下载的方法?(没人整理)。作为一个懒人,自然而然就希望有一个方法,可以下载顶会/顶刊的所有论文,或者是下载某一次会议/期刊中含有感兴趣的关键词的论文。于是趁着找论文的空隙,做了一个简单的自动论文下载器,该方法不仅可用于机器人领域,任何领域都能用。
模块
DBLP:是计算机领域内对研究的成果以作者为核心的一个计算机类英文文献的集成数据库系统。
BeautifulSoup:是一种可以从html和xml中快速提取内容的python库。
SCI-HUB:一个好用的免费下载各大文献的网站。
技术原理
1.使用BeautifulSoup库爬取DBLP上2019ICRA上的DOI链接和Titles,并保存到文件。(以2019ICRA会议为例)
2.提取到的DOI链接与SCI-HUB字符串结合,得到新的下载页面。
3.提取Title文件,写入List。
4.遍历所有论文链接下载,命名为论文Title。
5.若需要筛选字符串,可先判断Title是否含有该字符串。
效果
以ICRA2019为例。首先在DBLP搜索ICRA2019,有以下结果。
DBLP上ICRA2019的论文集
提取的SCI-HUB+DOI下载链接
论文Titles
下载效果
心动不如行动,关注公众号“Wow视觉”并回复“论文下载器”获得下载链接。