Python
文章平均质量分 50
水兵没月
这个作者很懒,什么都没留下…
展开
-
python爬虫-加速乐cookie混淆解析实例小记
将ob混淆代码另存在.js 文件,使用工具进行解密,成功后把解密后的js代码替换本地.html中的js 内容。将第一次请求拿到的cookie放在请求headers 里再次请求,同时将步骤一里响应内容进行解析。第一次请求:响应内容为混淆后的cookie值,该cookie作用为第二次请求的必要条件;第二次请求:响应内容为混淆后的cookie值,该cookie作用为最终请求的必要条件;本次我使用的fiddle进行抓包,可以直接请求得到响应,响应内容一样。最终请求:响应内容为我们看到的页面内容。原创 2023-07-28 17:22:48 · 1606 阅读 · 0 评论 -
python爬虫-获取headers(报文头)关键参数实例小记
注意由于是找headers的参数,因此断点打完后要去掉cookie重新请求。某XX网站逆向实例仅作为学习案例,禁止其他个人以及团体做谋利用途!某XX网站逆向实例仅作为学习案例,禁止其他个人以及团体做谋利用途!但是该参数在js 文件里只有一个,且是个常量,这时候可以看到有个。的附近会出现断点不起作用,这时候可以考虑在在。仅作为笔记记录,如有问题请各位大佬来指导。第三步:打断点(debug),第一步:请求页面,得到响应。的附近或者该js 文件中搜索。这里可以看到 最后返回一个。,通过查看确定是生产。原创 2023-07-14 11:26:03 · 3914 阅读 · 0 评论 -
python爬虫-获取cookie实例小记
通过在堆栈处可以看到执行顺序,reload 函数的上一步是匿名函数。第六步:断点处可以看到两个值,分别是_0x23a392和_0x5e8b26。第四步:进入到匿名函数后,可以看到reload(arg2) 说明x=arg2 (加载时间很长,无耐心看不到的哦。_0x5e8b26 这个值进行搜索,可以看到是一个常量(不明白的同学,可以私我或者看图自悟)某XX网站逆向实例仅作为学习案例,禁止其他个人以及团体做谋利用途!某XX网站逆向实例仅作为学习案例,禁止其他个人以及团体做谋利用途!第一步:请求拿到响应内容。原创 2023-06-29 17:26:53 · 1816 阅读 · 2 评论 -
python爬虫-逆向实例小记-3
注意!!!!某数据网站逆向实例仅作为学习案例,禁止其他个人以及团体做谋利用途!!!!原创 2023-06-27 21:34:39 · 1333 阅读 · 0 评论 -
python爬虫-逆向实例小记-2
加密解密鄙人能力有限仅在js 文件中测试出来结果未能将其改写成python。原创 2023-06-26 16:29:31 · 1313 阅读 · 0 评论 -
python爬虫-逆向实例小记-1
从下图可知,f 是key ,h 是偏移量(vi), n 是通过hex 和base64 包装后的一大串内容。第四步:从一大串响应内容到得到页面正常的内容,调用了f m(t)函数, 鼠标放在该位置,会得到相关的.js 文件。某政府网站逆向实例仅作为学习案例,禁止其他个人以及团体做谋利用途!某政府网站逆向实例仅作为学习案例,禁止其他个人以及团体做谋利用途!第三步:通过手动进行下一步会得到每一步的操作后的内容(与调试debug是一样的)第六步:一步一步执行,就可以看到从“乱码”到内容的关键过程。原创 2023-06-20 16:05:42 · 1180 阅读 · 0 评论 -
小记——python requests 请求响应类型 转为 scrapy 请求响应类型
通过这种方式就可以将requests 响应内容嵌在scrapy 框架里用了。原创 2023-03-15 15:24:14 · 181 阅读 · 0 评论 -
小记-HTML 转义 &#XXXX 如何转义为中文
【代码】小记-HTML 转义 &#XXXX 如何转义为中文。原创 2023-03-15 15:16:04 · 4855 阅读 · 0 评论 -
Mac 报错Message: session not created: This version of ChromeDriver only supports Chrome version 79
Python使用selenium 出现上述报错因为ChromeDriver与本地chrome浏览器的版本不一致导致。解决方法步骤一:查看本地Chrome 的版本原创 2021-10-28 09:36:59 · 830 阅读 · 0 评论 -
企业微信添加群机器人并向群里发布消息
背景在开发时出现一些需要实时监控的任务,类似服务器挂了,执行脚本未按时执行,报错日志展示等。需要及时通知,以免造成重大损失。配置企业微信群机器人企业微信有对外开放的api 接口,只要配置相关参数即可使用步骤1:创建企业微信机器人的webhook地址 1:打开企业微信——点击群聊标志???? 2:进去聊天信息界面之后,点击"群机器人" 3:进去之后,可以看到机器人支持Webhook协议,配置好之后,可以将业务信息推送到群里...原创 2021-06-03 15:04:39 · 3202 阅读 · 0 评论 -
Python对比两个文件夹中文件并筛选出差异文件
import osimport shutildef diff_file(path1, path2): path = '/Users/XXXXX/Desktop/test3' fileName1 = set([_ for _ in os.listdir(path1)]) fileName2 = set([_.replace('.htm', '.pdf') for _ in os.listdir(path2) if '.htm' in _]) diffs = fileNam.原创 2021-05-27 16:39:21 · 2536 阅读 · 0 评论 -
查列表中出现重复的数据及出现次数
因公司业务需要,需要找出文件夹中相同文件名(不考虑文件格式的情况下)fileNameList = [_.split('.')[0] for _ in os.listdir(html_path)]b = dict(Counter(fileNameList))pic_htm = [key for key, value in b.items() if value > 1]htm = [key for key, value in b.items() if value < 2]print(p原创 2020-09-01 16:29:54 · 520 阅读 · 0 评论 -
找出两个文件夹中不同文件,并另存
# -*- coding:utf-8 -*-import osfrom shutil import copydef main(): pdf_path = r'D:\\pdf_file' html_path = r'D:\\html_file' # 遍历两个路径下的文件 其中.htm的文件进行筛选,和PDF文件内容进行文件名(不含.pdf和.HTML)的对比找出不在对方文件中.pdf文件,保存到另外一个文件中 pdf_list = set([_.split('.')[0] for _ in .原创 2020-08-27 16:06:27 · 1203 阅读 · 0 评论 -
使用fake_useragemt 库随机生成useragent(脚本)
https://pypi.org/project/fake-useragent/(官方文档)使用fake_useragent中的方法,通过脚本生成大量的报文头供自己使用(脚本仅供参考)from fake_useragent import UserAgent for i in range(50): u = UserAgent().random with ope...原创 2018-10-20 22:39:03 · 743 阅读 · 0 评论