![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Py爬虫
爬虫学习
moon__________
这个作者很懒,什么都没留下…
展开
-
stale element reference: element is not attached to the page document的解决办法
出现这种问题时刷新一下element即可 // An highlighted block aList = web.find_elements_by_class_name("item__10RTO") count = len(aList) for i in range(0,count): item = aList[i] #操作 aList = web.find_elements_by_class_name("item__10RTO") #刷新element ...原创 2021-09-04 21:36:16 · 404 阅读 · 0 评论 -
2021-08-31
数据分析xpathbs4正则 xpath 解析原理: 1.实例化一个etree对象,将源码数据加载到对象中 2.调用etree对象的xpath方法实现标签的定位和数据提取 实例化etree对象 1.etree.parse(‘filename’)加载本地html文档 2.etree.HTML(page_text)加载获取的网页源码数据 标签定位: 左侧的/ tree.xpath(’/根目录’) 最左侧"/"后一定是根目录 非左侧的/ tree.xpath(’//tag1/tag2’) tag2是tag1的子原创 2021-08-31 23:56:22 · 56 阅读 · 0 评论 -
2021-08-09
爬虫训练网站 爬虫基础爬虫训练 基础爬虫训练 import urllib.request respone = urllib.request.urlopen("http://www.baidu.com") print(respone.read().decode('utf-8')) 超时处理 try: respone = urllib.request.urlopen("http://www.baidu.com",timeout=0.1) except urllib.error.URLError as原创 2021-08-09 23:44:00 · 62 阅读 · 0 评论