python,爬虫
一桶二锅头
这个作者很懒,什么都没留下…
展开
-
近期三日的网络爬虫和API的小结
最近三天由于功能需求,在编写面向各大音乐网站的网络爬虫。起初以为工作量不是很大,只是简单的重复而已,后来发现事情没有那么简单。 首先是30日晚简单地试了一下各大音乐网站的功能,得出结论能使用的有酷我音乐,百度音乐,酷狗音乐(网易云很想用,但是不符合需求。虾米没来得及测试)。第二天开始进行爬虫测试。对酷狗音乐,照例先是GET主页,结果出乎意料,收到了一个循环重定向向主页的response。通过查询原创 2017-09-03 20:09:26 · 506 阅读 · 0 评论 -
Python2手动识别验证码的爬虫
一 验证码机制 验证码是网站为预防爬虫或暴力破解密码等行为而实行的简单有效的机制。一般的验证码采用的是由客户端发送GET请求,请求中包含一个13位时间戳(下文中的例子即是如此)。时间戳起到的是区分用户的功能,举例来说,A,B两人同时发送验证码请求给服务器,之后服务器会生成两个验证码给A和B。但如果A看过之后输入的是B的验证码,那服务器当然不能让其通过验证了。这样服务器通过用户请求中的时间原创 2017-08-20 08:53:57 · 1452 阅读 · 0 评论