Python爬虫与js逆向
以实战为线索,以实践为武器,实现网络数据的爬取
漫路在线
一个喜欢安全的小白
展开
-
JS逆向——百度翻译
我们在爬虫时经常会遇到一些奇怪的参数,比如百度翻译的sign,网易云音乐的params等,这个时候就要用js逆向的技术来获取参数的构造方法前置准备Chorme浏览器,Sublime编译器,Python爬取链接:https://fanyi.baidu.com/抓包按下F12打开Chrome的开发者什么玩意,选中Network——XHR,然后在翻译框中随便输入一个单词,看弹出的请求查看一下请求,发现在链接为https://fanyi.baidu.com/v2transapi?from=en&原创 2020-08-06 20:58:21 · 2298 阅读 · 0 评论 -
Python爬虫-音乐下载器
仅供参考学习,禁止用于非法用途目录1.第三方库准备安装库requests selenium webdriver以及 PhantomJS2.创建目录创建主目录Music_Downloader创建文件 Music_Downloader.py在同目录下创建包Downloader在包中创建文件kugou.pykuwo.pywangyiyun.pyQQMusic.pyqianq...原创 2020-04-01 22:32:40 · 1665 阅读 · 1 评论 -
Python 爬取有道翻译
前情提要爬取的网站http://fanyi.youdao.com/遵循业内规则,我们先看一下robots协议http://fanyi.youdao.com/robots.txt内容是这样的OK,可以爬取,那我们就正式开始分析网页我们爬虫的第一步自然是先要分析网页,我们先随便输入两个单词可以看到,我们在输入内容后,右侧自动出现了翻译结果,这种情况一般是ajax异步加载这里介绍一下什么是ajax异步加载AJAX 是一种在无需重新加载整个网页的情况下,能够更新部分网页的技术。摘自htt原创 2020-07-18 19:28:43 · 733 阅读 · 0 评论