![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python爬虫
文章平均质量分 86
铁头七娃
这个作者很懒,什么都没留下…
展开
-
Python抓取期刊ISO缩写
想法的来源在投稿SCI期刊时,某些期刊要求引用文献部分要引用期刊的缩写。期刊的缩写有两种,JCR缩写和ISO缩写,二者对于某些期刊是不同的。而所用的文献管理软件Noteexpress中自带的是JCR缩写形式,ISO期刊需要逐条查询并导入,因此产生了从JCR官网上自动查询并抓取缩写的想法。确定方法由于博主之前完全没有接触过爬虫,对于python的了解也很少,甚至连其基本的语法都不清楚,因此在确定爬取方法的过程中走了一些弯路。刚开始采用的是requests_html模块,此模块对于部分网页是很好用的原创 2021-08-30 16:55:57 · 672 阅读 · 0 评论 -
selenium使用注意事项
selenium使用中的注意事项选择元素报错的情况1 元素未加载有时,受限于网速,抓取元素时网页还没有加载完成,因此会出现报错的情况。这种情况,只需要加入等待或者延时操作即可,selenium提供了隐式等待函数implicitly_wait()。隐式等待表示在自动化实施过程中,为查找页面元素或者执行命令设置一个最长等待时间。如果在规定时间内页面元素被找到或者命令被执行完成,则执行下一步,否则继续等待直到设置的最长等待时间截止。更多详细的关于等待的命令,可参考selenium之WebDriverWait原创 2021-08-30 16:53:36 · 719 阅读 · 0 评论