scrapy html页面加载未完成,【已解决】Scrapy如何加载全部网页内容

本文介绍了在Scrapy中遇到HTML页面加载不完全的问题,以及如何通过分析浏览器网络请求,找到动态加载内容的POST请求,并在Scrapy代码中模拟该请求以获取完整信息。通过调试工具发现额外的HTTP POST请求,然后在Scrapy中实现相同请求,从而成功加载全部网页内容。
摘要由CSDN通过智能技术生成

折腾:

期间,

已经可以去用scrapy打开页面:

了,但是返回的页面,却是没有加载全部的内容:

50a2db03149fcfcc5bf1b04b218a0c23.png

全部加载的应该是这样的:

bd2eab8dbe4a7db3c0f95e7238b08037.png

scrapy page load not completed

scrapy page loading

还是去用chrome调试,看看到底加载了数据的js和请求是什么

找到了:

POST /loadvideo/23t1f8d2ISs HTTP/1.1

Connection: keep-alive

Content-Length: 0

Pragma: no-cache

Cache-Control: no-cache

Accept: application/json, text/javascript, */*; q=0.01

X-Requested-With: XMLHttpRequest

User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHT

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值