前言
嗨喽!大家好呀,这里是魔王~
课程亮点:
- 系统分析网页结构
- 动态数据抓包演示
- json数据解析
- JS解密
环境介绍:
- python 3.8
- pycharm >>> 需要安装nodejs插件
- Nodejs 解释器 用来运行JS代码的
模块使用:
- requests >>> pip install requests
- execjs >>> pip install pyexecjs
如何安装python第三方模块:
- win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车
- 在pycharm中点击Terminal(终端) 输入安装命令
如何配置pycharm里面的python解释器?
- 选择file(文件) >>> setting(设置) >>> Project(项目) >>> python interpreter(python解释器)
- 点击齿轮, 选择add
- 添加python安装路径
pycharm如何安装插件?
- 选择file(文件) >>> setting(设置) >>> Plugins(插件)
- 点击 Marketplace 输入想要安装的插件名字 比如:翻译插件 输入 translation / 汉化插件 输入 Chinese
- 选择相应的插件点击 install(安装) 即可
- 安装成功之后 是会弹出 重启pycharm的选项 点击确定, 重启即可生效
爬虫案例基本流程:
一. 数据来源分析
- 确定采集网站视频, 需要什么数据
- 通过开发者工具进行抓包, 分析我们想要的数据 是那个url地址发送的请求
post 请求 >>> 需要提交data表单数据
分析请求参数变化规律, sign 参数, 每次请求都不一样
第一种方式扣代码:
- 做JS解密, 其实就扣代码 我想要sign参数 是哪里来的, 把那一段代码扣下来
- 运行JS代码, 运行之后, 肯定是会报错的 一般情况 什么什么没有定义, 缺什么补什么
通过python 去调用JS代码内容 从而得到返回数据内容
第二方式直接用python改写JS代码:
二. 代码实现过程: 发送请求, 获取数据, 解析数据, 保存数据
- 发送请求, 对于翻译接口发送请求
- 获取数据, 获取服务器返回数据内容
- 解析数据, 提取我们想要翻译结果
如果想要去做JS解密, 首先就要分析它是那个参数加密的 其次呢 去分析加密参数是通过那个JS代码生成的,怎么生成的 然后就是扣代码
JS逆向里面最简单一个案例…没有之一
代码
代码里网址被我删了好过审核,想要得小伙伴可看评论或私聊我领取~
# 导入数据请求模块
import requests
# 导入格式化输出模块
import pprint
# 导入execjs
import execjs
# 导入md5解密模块
import hashlib # 内置模块
# 导入时间模块
import time
# 1647329439.9328077
# 16473294570110
# 16473295059531
# m3u8 AES加密
while True:
word = input('请输入你想要翻译的内容(输入0即可退出): '