自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 破解加速乐cookie加密

目标网址:aHR0cDovL3d3dy5nc3h0Lmdvdi5jbi9TZWFyY2hJdGVtQ2FwdGNoYT90PTE2MjcxOTgwMzAzODk= (其中的t参数为当前时间戳)加速乐特征:“__jsl”开头的cookie破解流程:第一步:请求目标网址,会返回状态为521的响应,其响应内容为一段设置cookie的js,将其抠出来运行之后,获得cookie值“__jsl_clearance”。第二步:cookie带上js生成的“__jsl_clearance”和第一步中返.

2021-10-29 09:13:25 1106 1

原创 国家统计局2020年统计用区划代码全量采集

公司业务需要,把相关数据采集了一遍,在此记录。采集链接:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2020/index.html(可修改对应年限)使用了scrapy框架,这里直接贴spider代码,存储代码因人而异就不贴了。import scrapyimport refrom china_city_spider.items import ChinaCitySpiderItemclass ChinaCitySpider(scrapy..

2021-09-27 14:13:52 1324

原创 某验第三代滑动验证码分析(最新):第三部分

接着之前的部分来,老规矩,仅供学习研究,勿用于商业用途第三步:加密轨迹并提交验证加密滑动轨迹我们先来看最终提交验证的接口:可以看到有加密参数w(第三个),想都不用想,这加密里肯定包含滑块轨迹。加密逻辑在slide.7.8.3.js,需要先解混淆(按第一部分的方式来),然后用老办法,直接搜索"w"(带引号):可以看到只有一处匹配,直接打上断点就能断到需要注意o[“passtime”]的变化,后面需要替换成轨迹里最后一个点通过的时间。可以看到这里的加密跟第一个w的加密很像(确实如此.

2021-09-01 13:03:30 663 1

原创 某验第三代滑动验证码分析(最新):第二部分

接着之前的部分来,老规矩,仅供学习研究,勿用于商业用途第二步:识别验证码图片缺口距离验证码图片还原将两张验证码背景图片(带缺口和不带缺口)下载到本地之后,可以看到它们大概长这个样子的:可以看到图片是被打乱了的,需要进一步还原图片的还原逻辑在slide.7.8.3.js里,混淆还原就不说了吧,第一部分里面有。关键逻辑我们可以通过追堆栈找到(这是下下策),想要快速定位的话,推荐hook或者搜索关键字,看看两种方式:hook:由于某验验证码是用canvas绘图的(F12查看验证码元素可以.

2021-08-31 12:53:40 432

原创 某验第三代滑动验证码分析(最新):第一部分

本案例仅用作学习研究,严禁商业用途!若本项目侵害了贵公司的权益,请及时联系我做相应处理。本案例用的官网滑块,2021-8-26可用,相关js版本:fullpage.9.0.7.js slide.7.8.3.js破解流程首先上一个滑动验证码通用的一个破解流程:获取验证码图片 -> 获取缺口距离 -> 生成轨迹并加密提交某验三代滑动验证也是同样的流程,只不过每个小流程下面细分步骤相对比较多,先说一下大致的一个过程:获取验证码图片请求register接口,拿到gt和cha.

2021-08-27 13:48:57 1073 2

原创 conda:Linux上的python虚拟环境迁移(离线)

conda:Linux上的python虚拟环境迁移(离线)在工作中,我们开发出来的程序往往还需要面临着部署的问题,而当我们要部署的机器没有网时????。。。离线环境下,最重要的就是尽可能保证我们程序的运行环境和开发环境一致,以确保程序能够正常运行。我平时习惯使用conda来安装python(真的方便,推荐安装miniconda,要小很多),之前在环境迁移的时候就是简单的把envs(通常是/root/miniconda3/envs)文件夹下的指定虚拟环境目录全部拷走,放在部署机上的同样位置。大多数情况

2021-03-15 10:22:41 1900

原创 python中使用json序列化datetime

python中使用json序列化datetime在python中使用json.dumps()时,是无法将datetime格式的数据转化成json的,会报如下错误:此时,我们需要为dumps()函数指定一个encoder:def json_encoder(obj): """提供给JSONEncoder的default方法,json将按要求格式化指定类型的对象""" if isinstance(obj, datetime.datetime): return obj.str

2021-03-04 17:20:30 930 1

原创 python实现驼峰式命名与下划线命名互相转换

import redef name_convert_to_camel(name: str) -> str: """下划线转驼峰""" contents = re.findall('_[a-z]+', name) for content in set(contents): name = name.replace(content, content[1:].title()) return namedef name_convert_to_snake(

2021-02-06 16:56:30 5625 7

原创 scrapy_redis分布式设置项

# 连接redisREDIS_URL = "redis://localhost:6379/0"# 指定去重类DUPEFILTER_CLASS = "scrapy_redis.dupefilter.RFPDupeFilter"# 指定调度器SCHEDULER = "scrapy_redis.scheduler.Scheduler"# 是否持久化(增量爬虫)SCHEDULER_PERS...

2019-03-23 14:59:33 244

原创 python爬虫学习(3)增加访问量,自我安慰系列~

当我写出标题的时候,这篇博文就开始被我用做测试了。(源码)Github:https://github.com/OSinoooO/CSDN_readingCount_increase 昨天晚上看着自己写的博文,太低级了都没有人看呐   (┬_┬)突发奇想要不给自己增加一下阅读量,自我安慰一下?ヽ(-`Д´-)ノ想到就做,于是就开始了我的测试: 先弄清楚阅读量增加的机制...

2018-08-01 01:36:28 3027 1

原创 python爬虫学习(2)用tesserocr识别图像验证码

在学习爬虫的过程中难免会遇到验证码问题,作为纯自动化的爬虫是不可能手动去输入验证码的。那么我们就要学会怎么去识别它。而验证码也分很多种类,主要的几种:(1)图像验证码:这是最简单的一种,也很常见。就比如CSDN登录几次失败之后就会出验证码。(2)滑块验证码:需要按住滑块并移到正确的位置。比如bilibili的登录验证。(这个我也写过识别代码,源码托管github:https:/...

2018-07-31 01:46:50 12499 11

原创 Windows下Pycharm运行命令行语句结果乱码问题��Ȩ��Ӧ��

今天在学习python多线程的时候遇到了一个问题import subprocessprint('$ nslookup www.baidu.com')r = subprocess.call(['nslookup', 'www.baidu.com'])print('Exit code:', r)"$ nslookup www.baidu.com"语句相当于在cmd中输入:nslookup ww...

2018-06-15 01:41:21 8550

原创 python爬虫学习(1)爬取微软必应翻译(中英互译)

参考博客:https://blog.csdn.net/c406495762/article/details/59095864                 https://blog.csdn.net/weixin_42251851/article/details/80489403       本人属于python新手,刚学习的 python爬虫基础迫不及待地想试一试,看了论坛里大佬们写的在线翻译...

2018-06-12 14:29:28 5324 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除