- 博客(2)
- 收藏
- 关注
原创 scrapy xpath实现页面多次提取
scrapy xpath实现页面多次提取 第一次提取, change_old = response.xpath('//*[@id="_container_changeinfo"]/table/tbody/tr') 如果需要继续提取下一级, 后面不能加extract(), 因为extract()处理过的对象就变成了str格式 针对经过提取以后的以下html: <tr> <td...
2019-06-06 10:42:06 1028
翻译 爬虫问题检查点
问题检查表 首先,如果你从网络服务器收到的页面是空白的,缺少信息,或其遇到他不符合你预期的情况(或者不是你在浏览器上看到的内容),有可能是因为网站创建页面的JavaScript执行有问题。 如果你准备向网站提交表单或发出POST 请求,记得检查一下页面的内容,看看你想提交的每个字段是不是都已经填好,而且格式也正确。用Chrome 浏览器的网络面板(快捷键F12 打开开发者控制台,然后点击“Ne...
2018-09-13 17:24:50 4892
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人