- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 爬虫练习(三)爬取知网上文章的摘要---笨方法
因为一些特殊的需要,需要爬取一些数据,对之前的进行了更改。供大家交流。采取了一些笨方法,重点是学习使用功能和语言。from selenium import webdriverfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.common.by import By
2021-11-24 00:22:15 1121 3
原创 爬虫练习(二)爬取知网上文章的摘要
因为一些特殊的需要,需要爬取一些数据,对之前的进行了更改。供大家交流。from selenium import webdriverfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.common.by import Byfrom selenium.webdrive
2021-11-24 00:18:17 1139
原创 爬虫练习(一)爬取知网、万方、维普文献标题、作者、刊物来源等信息
刚刚开始学习Python,今天一周整,浏览了站内一些大侠博客相关内容,自己也尝试着写了一个爬虫。直接借鉴了几位大侠的经验,如有冒犯之处恳请海涵。先说说目的吧,本爬虫的目的是根据EXCEL文件的作者名字信息,以及设定的单位信息来自动循环爬取文章题目、作者姓名、期刊名称、发表时间(刊次)、下载量、被引量等信息并保存到CSV文件中。用到了chromedriver、selenium、xlrd、pandas因为我爬取的作者发文量比较少,万方、维普部分,没有做分页查询。因为太懒,查询函数没有做成模块
2020-05-18 22:49:47 7176 4
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人