上一篇只是说了想法,但是talk is cheap,show me the code. 我有个蛮不错的想法,打算连接微信公共账号和豆瓣小组,具体的想法我会在下一篇说明。这就需要抓取内容(上一篇文章),评论内容(今天所做的事情)。在微信公共账号那边就要获取内容,然后返回相应的内容,这是另一种技术了。
由于登录活动频繁,豆瓣每次都要我输入验证码,实在是很讨厌。以后可能会接入ocr程序去分析,但是目前的话,只能靠人工去输入了。也就是说,把验证码的连接拿出来,用网页打开,然后人工输入。还好基本每天检查一次就可以了,其他时间可以利用cookies。
captcha-solution就是验证码,-id就是验证码的id了。(如果验证码实在厌烦,可以试试看同时使用一个验证码去登录会怎么样。)
<img id="captcha_image" src="https://www.douban.com/misc/captcha?id=nZhBvLIyC99t3jJSNP71051N:en&size=s" alt="captcha" class="captcha_image