![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
文章平均质量分 90
。
浸 ·
努力读书,赚钱赚钱赚钱
展开
-
UA池大全
“Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)”“Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0)”“Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/5.0)”“Mozilla/4.0 (compatible; MSIE 10.0; Windows NT原创 2021-03-09 15:12:04 · 4711 阅读 · 0 评论 -
Scrapy使用方法【不断更新】
创建一个工程scrapy startproject xxx创建一个爬虫文件先通过cd设置文件目录再通过scrapy genspider Spidername www.xxxx.comimport scrapyclass FirstSpider(scrapy.Spider): #爬虫文件名称:爬虫源文件唯一标识 name = 'first' #允许的域名:限定start_url中那些可以进行请发送 #allowed_domains = ['www.xxx原创 2021-02-24 22:51:52 · 252 阅读 · 0 评论 -
selenium库的一些使用【不断更新】
文章目录webdriver.Chrome()getpage_source查找节点的几种方法节点交互动作链(ActionChains)京东物品详情页的物品价格,发现requests不能获取价格,说明是动态加载使用page_source和etree配合后可以抓取这样的内容from selenium import webdriverimport timefrom lxml import etreeurl="http://xxxxxxx.com"browser=webdriver.Chrome()原创 2021-02-22 13:45:07 · 141 阅读 · 0 评论