- 博客(21)
- 收藏
- 关注

原创 快手 web moblie PC did 56位 __NS_sig3 适用快手创作者中心
用户首页 详情页 视频列表 视频详情 包含快手系web端__NS_sig3 通用。快手WEB端 DID 滑块协议 滑块算法。web 56位 __NS_sig3 快手通用。
2024-06-05 16:38:49
1059
4

原创 快手爬虫 解决粉丝数 关注数等字体加密 python快手爬虫
想拿一下粉丝数 关注数 描述等发现字体是加密的 elements是这样的源代码里是这样的找了找js 原来是用这些玩意 去这个ttf里一一对应 然后用 js + css画出来的找到问题所在,就fuck掉它把js扣出来?用execjs去执行?太LOW了既然做python 那就用python去重写首先用re去拿这个ttf的url (因为每次都变)先给这玩意下载下.
2020-09-28 19:05:01
1548
1
原创 雪球 md5__1038
接下来就是补环境 要补的环境不多 有一些麻烦的点就是 其中用了浏览器的方法 但是node已经淘汰掉的方法。这种作者直接去用笨方法 找到格式化检测点 然后压缩直接绕过去了 不用去读代码 方便快捷。一看就是一个大的webpack 整个搞下来 run发现卡死了。第一次响应无数据 第二次携带了一个md5_1038的参数。这种就需要去debug看了 最后补完 就出来了。很少做这种二级html的逆向。这种一般都是有格式化的检测点。偶然看到一个网站 想着搞搞。原来返回了一个混淆过的js。首先发现请求是出现了两次。
2024-12-19 16:37:32
1175
3
原创 快手__NS_hxfalcon sig4 视频列表 历史数据 视频详情 用户详情
_NS_hxfalcon 逆向。请求视频列表页 可翻页获取所有。
2024-12-04 11:13:19
461
原创 python截取字符串 -- split
现在有一串url我想拿请求的url 不想带参数 怎么方便取呢“string.split”很方便就切成两片了 会变成list 拿想要的那片就ok了run
2020-09-29 11:19:29
236
2
转载 d音APP爬虫 dy算法 暴力获取 init_gorgon(), x-gorgon
声明:此贴只做学习交流使用,不得用于违法行为,如触犯刑法,后果自负。听说抖音新版本的加密措施保护的很是严格,瞬间想皮一下~ 闲话少bb,直接刚~1、用到的工具等:Charles (随便一个抓包工具即可,哪个顺手用哪个)动态字段: x-gorgon:0408*** (开头)抖音Version:12.8.0 (发帖时的最新版本)or 抖音极速版 (文件少,编译快)IDA or JEBJadx-guifridaPycharmroot 真机(Android) or 模拟器2、反编译:Apk
2020-09-24 11:52:29
2509
2
原创 python eventlet linux python2.7 used
首先改变一下pip 源 使用阿里源 不然太慢了sudo mkdir /root/.pipsudo vim /root/.pip/pip.conf[global]index-url = http://mirrors.aliyun.com/pypi/simple/[install]trusted-host=mirrors.aliyun.com一般会遇到 requests 和 urllib3 无法使用问题 需要把requests 和 urllib3都卸载重装sudo pip uninstall r
2020-09-18 17:02:26
327
原创 LINK
ip验证:http://httpbin.org/get解析完的各种库https://www.lfd.uci.edu/~gohlke/pythonlibs/异常处理https://www.runoob.com/python/python-exceptions.htmlweb文字可编辑javascript:document.body.contentEditable=‘true’;document.designMode=‘on’; void(0);...
2020-09-18 16:58:08
163
原创 eventlet协程池创建 异步请求
import eventleteventlet.monkey_patch(socket=True, select=True)def func(id): print(id)if __name__ == '__main__': pool = eventlet.GreenPool(1) for offset in id_list: pool.spawn_n(f...
2020-09-18 16:51:46
231
原创 selenium getHttpStatus && getHttpResponseHeader
from selenium import webdriverfrom selenium.webdriver.common.desired_capabilities import DesiredCapabilitiesimport jsond = DesiredCapabilities.CHROMEd['loggingPrefs'] = { 'performance':'ALL' }...
2020-09-18 16:51:12
135
原创 selenium 无界面chrome 界面足够大不需要下拉浏览器滚动条 && 智能等待
from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.support.wait import WebDriverWait...
2020-09-18 16:50:47
185
原创 随机取user-agent
def header(): agent_list = [ "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1", # NOQA "Mozilla/5.0 (Windows NT 6.1; WOW6...
2020-09-18 16:49:05
227
原创 requests获取cookie
def get_token(): url = u'https://open.spotify.com/search/artists/A' web_data = requests.get(url, headers=header()) set_cookie = web_data.headers['Set-Cookie'] r_coo...
2020-09-18 16:48:22
165
原创 Python爬虫面试整理
1.自我介绍2.抓住问题询问3.协作管理 GIT github爬虫方向:0. requests,urllib,urllib2请求方法常用的几种, POST与 GET的区别,传参时payload formdata的区别1》传送数据方式不同,get是通过 url 传送。post是通过form data 在 header 头部传输。2》url 是明文传送, post 是通过 form data 编码传输。3》get 通过从服务器获取数据, post 是向服务器提交数据。4》url 长度有限
2020-09-18 16:41:33
229
空空如也
快手 web mobile端 56位 __NS_sig3
2024-05-29
TA创建的收藏夹 TA关注的收藏夹
TA关注的人