数据获取
Jumping boy
爱好计算机视觉、机器学习、深度学习、网络安全等
展开
-
有道翻译接口问题(续)
原博文地址:https://blog.csdn.net/qq_40962368/article/details/80620817自从写了上面的博文之后,很多人询问我关于有道翻译接口的问题,为什么不是F12中的http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule当时,我在面对这个问题时,也是一...原创 2019-04-06 11:35:52 · 1434 阅读 · 2 评论 -
有道翻译接口问题
博文更新:更新地址:https://blog.csdn.net/qq_40962368/article/details/89053068原博文:在调用有道翻译api接口时,出现了如下错误:您要翻译的内容是:englishTraceback (most recent call last): File "D:/Python.workspace/Hello world/Web S...原创 2018-06-08 11:40:57 · 6351 阅读 · 8 评论 -
利用URL拼接爬取获取有道翻译内容
利用URL拼接爬取获取有道翻译内容代码:import requestsimport chardetimport jsonif __name__ == '__main__': i = input('请输入要翻译的内容:') url = 'http://fanyi.youdao.com/translate?i=%s&smartresult=dict&am...原创 2019-04-06 23:51:55 · 1238 阅读 · 0 评论 -
爬虫:利用cookie获取人人网登录后网页信息
爬虫:利用cookie获取人人网登录后网页信息思路:1、首先创建一个自动获取登录cookie的实例,创建请求管理器opener2、分析网页源码,获取登录的form信息,并写入data,访问登录界面url,获取cookie信息3、分析登录后页面url,利用得到的cookie信息获取网页一、创建cookie实例及请求管理器openerfrom urllib import ...原创 2019-04-08 00:19:11 · 1017 阅读 · 0 评论 -
爬虫:获取豆瓣电影爱情片榜单封面图片
电影中单纯而美好的爱情总是让人陷入美好无瑕的幻想。代码已上传至个人GitHub,可供查看:获取豆瓣电影爱情片榜单封面图片爬虫:获取豆瓣电影爱情片榜单封面图片目的:获取豆瓣电影爱情片榜单封面图片,并保存到本地。思路:1、分析网页URL,查看规律2、敲代码(图片名设置为该电影名称)一、打开豆瓣电影分类排行榜-爱情片,F12审查元素在向下滑动的过程中,发现如下...原创 2019-04-11 17:07:23 · 6301 阅读 · 0 评论 -
爬虫:突破有道翻译js加密(最新)
爬虫:突破有道翻译js加密代码已上传至个人GitHub,可供下载:突破有道翻译js加密思路:(python版本3.6)1、分析post上传form信息,发现存在加密行为2、查看网页js文件,分析加密函数3、根据加密函数原理进行解密,突破有道的翻译接口一、打开有道翻译网页,按F12键,并输入内容进行翻译,可以看到服务器对网页请求作出的回应,最需要关注的是上传的信息和上...原创 2019-04-08 22:53:39 · 983 阅读 · 6 评论 -
爬虫:验证码识别准确率(Tesseract-OCR)
爬虫:验证码识别准确率(Tesseract-OCR)现在的网站为了防止人们轻易的获取登陆后的页面信息,在登陆上设置了很多的障碍,验证码就是其中的一种,所谓道高一尺,魔高一丈,人们总能想出办法来予以应对,但是,应对的成本可能在不断加大,这在一定程度上提升了反反爬虫的门槛。本文的目的在于验证Tesseract对普通验证码图片的识别准确率,以便为后续的工作做准备。Tesseract是一个开源...原创 2019-04-16 13:27:42 · 8000 阅读 · 3 评论 -
验证码随机生成
验证码随机生成这里主要使用到的库是captcha库,下载的命令如下:pip install captcha验证码随机生成代码,(python 版本:3.6 captcha 版本:0.3)from captcha.image import ImageCaptchaimport numpy as npimport matplotlib.pyplot as pltfro...原创 2019-08-07 20:14:45 · 453 阅读 · 0 评论