使用scrapy框架爬取网站《乌龟量化》的股票信息遇到的一些问题即暂时的解决方案

在使用Scrapy框架爬取《乌龟量化》网站的股票信息时,遇到了登陆问题和cookie传递难题。通过结合Selenium和Splash,解决了登陆和页面渲染问题,但Cookie传递仍需手动操作。本文总结了遇到的挑战及临时解决方案。
摘要由CSDN通过智能技术生成

1.登陆过程中遇到的问题

登陆界面
本人想采用第一种登陆方式登陆账号,点击《登陆方式一:账号密码》,就会出现账号密码的输入框。但是网页的网址没有任何改变。所以想使用post请求直接将账号密码传送过去,但是却直接被决绝访问了。返回的是’服务器明白我的意思,但是拒绝访问‘。没办法,只能采用万能的方法了,使用selenium登陆之后再传回cookie进行登陆之后的页面解析行为。

2.cookie的传递过程中遇到的问题


传递了cookie之后,红色框框的数据全部都能访问到(不传递cookie的话只能访问部分),但是黄色框框内的数据无法正确访问,返回的是空列表。估计又是采用AJAX技术的网页。不会分析接口,因为是个小白。所以只能采用比较笨的办法采用了splash技术,可以获得经过渲染之后的网站HTML。
尝试过全程都使用splash,但是在登陆的时候选中了输入框,然后使用send_text(’aaaa‘)的时候账号密码一直无法输入进去。所以也只能采用selenium来实现模拟登陆了。

3.splash中的cookie传递(目前是手动解决的)

通过webdrive传过来的cookie是字典类型的,形式大概是这样。

[
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值