csdn一直是我比较讨厌的网站之一,总感觉它是想宁可错杀一千,绝不放过一个。爬虫抓取,远程登录等等都设置了很多障碍。
csdn登录的时候会发过来一个webflow号码,登录的时候需要一起发回去。这个其实很简单,先对网站发送一个get请求,从返回来的页面中抓到该号码,然后返回去就可以了。
execution是什么还不清楚,但是也是可以抓到的。先发送一个get请求。
self.request = requests.get(self.url, cookies=self.jar)
url就是csdn的登录网址,jar是个空cookie。得到内容截取:
<input type="hidden" name="lt" value="LT-23849645-aEV2DOFVYC4xENCIetgAIyaKgT9Siq" />
<input type="hidden" name="execution" value="e4s1" />
<input type="hid