爬虫篇
文章平均质量分 57
CyrusMay
这个作者很懒,什么都没留下…
展开
-
爬虫篇——selenium(webdriver)进行用户登录并爬取数据)
爬虫篇——selenium(webdriver)进行用户登录并爬取数据摘要(一)创建browser对象(二)用户登录(三)数据爬取摘要本文主要介绍了如何通过selenium使用Chormedriver进行用户登录并爬取数据,使用过程中需注意合理使用selenium.webdriver.support.expected_conditions和selenium.webdriver.support.ui.WebDriverWait(一)创建browser对象chromedriver.exe的下载地址为:原创 2022-01-25 15:20:04 · 3482 阅读 · 0 评论 -
爬虫篇——代理IP爬取备用及存储
爬虫篇——代理IP爬取备用及存储代码代码本文通过抓取免费的高匿IP代理,将其写入列表并保存为json格式文件,且将代码进行了封装,方便以后抓取数据时动态的更新handle的IP地址,从一方面避免抓取数据时反爬的干扰。# *************************** 西刺代理IP爬取 ****************************import urllib.request...原创 2020-04-24 18:31:04 · 36628 阅读 · 10 评论 -
爬虫篇——User-Agent爬取备用及存储
爬虫篇——User-Agent爬取备用及存储代码代码本文通过抓取常见的User-Agent(用户代理),将其写入列表并保存为json格式文件,且将代码进行了封装,方便以后抓取数据时实时更新请求头中的User-Agent,从一方面避免抓取数据时反爬的干扰。# *********************** User-Agent 爬取 ******************************...原创 2020-04-24 18:13:24 · 1155 阅读 · 2 评论