我在坑里玩泥巴-CSDN博客

原创 scrapy xpath实现页面多次提取

scrapy xpath实现页面多次提取第一次提取， change_old = response.xpath('//*[@id="_container_changeinfo"]/table/tbody/tr') 如果需要继续提取下一级，后面不能加extract(), 因为extract()处理过的对象就变成了str格式针对经过提取以后的以下html: <tr> <td...

2019-06-06 10:42:06 1028

翻译爬虫问题检查点

问题检查表首先，如果你从网络服务器收到的页面是空白的，缺少信息，或其遇到他不符合你预期的情况（或者不是你在浏览器上看到的内容），有可能是因为网站创建页面的JavaScript执行有问题。如果你准备向网站提交表单或发出POST 请求，记得检查一下页面的内容，看看你想提交的每个字段是不是都已经填好，而且格式也正确。用Chrome 浏览器的网络面板（快捷键F12 打开开发者控制台，然后点击“Ne...

2018-09-13 17:24:50 4892

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 scrapy xpath实现页面多次提取

翻译 爬虫问题检查点

空空如也

空空如也

翻译爬虫问题检查点