爬虫学习日记(三)

之前做的task发现commit的时候出现点问题,失败了,具体失败的原因还不知道。而且Cindy姐姐给我们讲QA的时候,也跟我讲了我做的有点问题,应该说是方向有点不对,邮件里面东哥说的是要改stack里面的信息,但是其实Cindy姐姐要的是改掉Content里面的东西,只要搜索不到的船的信息,这样子它爬虫爬不到数据之后,可能好做一些统计工作一些,或许吧。。。具体我的也不懂,QA工具还用的不是很熟练,正确来说应该是不会用。

Cindy的要求:

所以要重新改了

现在的问题就是,我测试不了!

我也不知道这个content里面的值是哪里传进去的,因为content里面有这些内容:

而在代码里面我也看到相似的:

所以我简单的以为,这些信息都是像之前我接触过得,是拼接而成的。 结果认真看的时候,发现其实这都是selenium里面的方法,模拟操作的,跟报的这个没有啥关系,而且我猜测,这个报的content里面的内容,就是selenium里面自己写好的exception,它爬不到数据:就是说网页上没有这条船的信息,就报nosuchexception,后面是各种的配置信息。

问题找到了,所以现在我要做的就是,把content里面的内容替换掉,但是我也没有找到任何传content的,也没有注释,估计有其中一个变量是往上面传的。

问了东哥

是这个,ok,好办了。

重新debug,发现真的对unittest里面的整个逻辑清楚了不少,我这里简单记录下好了:

最上面的红框,是设置一些你要搜索的信息。

下面执行crawler,crawler已经注入了instruction,就是各种配置信息,还有要用到的crawler,搜不同的网站就用相对应的crawler,然后执行excute方法,

excute方法里面获取task就是到执行crawler。

这里是抛出stack的时候。

然后在这里输出了这两个list:

结果发现都是空????

如果这里是空,那么content也应该是空的吧,而且执行到后面就直接抛出异常了,needLogPage也没有放东西进去了,很懵。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值