OSinooO
码龄9年
关注
提问 私信
  • 博客:44,493
    动态:53
    44,546
    总访问量
  • 13
    原创
  • 852,906
    排名
  • 35
    粉丝
  • 0
    铁粉

个人简介:想做个小爬虫...

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:四川省
  • 加入CSDN时间: 2015-10-14
博客简介:

qq_31998745的博客

查看详细资料
个人成就
  • 获得34次点赞
  • 内容获得26次评论
  • 获得124次收藏
  • 代码片获得216次分享
创作历程
  • 8篇
    2021年
  • 1篇
    2019年
  • 4篇
    2018年
成就勋章
TA的专栏
  • 逆向
    4篇
  • 验证码
    3篇
  • python爬虫
    4篇
  • python
    8篇
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

355人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

卷不动了,尾灯都看不见了

发布动态 2023.03.15

破解加速乐cookie加密

目标网址:aHR0cDovL3d3dy5nc3h0Lmdvdi5jbi9TZWFyY2hJdGVtQ2FwdGNoYT90PTE2MjcxOTgwMzAzODk= (其中的t参数为当前时间戳)加速乐特征:“__jsl”开头的cookie破解流程:第一步:请求目标网址,会返回状态为521的响应,其响应内容为一段设置cookie的js,将其抠出来运行之后,获得cookie值“__jsl_clearance”。第二步:cookie带上js生成的“__jsl_clearance”和第一步中返.
原创
发布博客 2021.10.29 ·
1147 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

国家统计局2020年统计用区划代码全量采集

公司业务需要,把相关数据采集了一遍,在此记录。采集链接:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2020/index.html(可修改对应年限)使用了scrapy框架,这里直接贴spider代码,存储代码因人而异就不贴了。import scrapyimport refrom china_city_spider.items import ChinaCitySpiderItemclass ChinaCitySpider(scrapy..
原创
发布博客 2021.09.27 ·
1374 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

某验第三代滑动验证码分析(最新):第三部分

接着之前的部分来,老规矩,仅供学习研究,勿用于商业用途第三步:加密轨迹并提交验证加密滑动轨迹我们先来看最终提交验证的接口:可以看到有加密参数w(第三个),想都不用想,这加密里肯定包含滑块轨迹。加密逻辑在slide.7.8.3.js,需要先解混淆(按第一部分的方式来),然后用老办法,直接搜索"w"(带引号):可以看到只有一处匹配,直接打上断点就能断到需要注意o[“passtime”]的变化,后面需要替换成轨迹里最后一个点通过的时间。可以看到这里的加密跟第一个w的加密很像(确实如此.
原创
发布博客 2021.09.01 ·
688 阅读 ·
4 点赞 ·
1 评论 ·
3 收藏

某验第三代滑动验证码分析(最新):第二部分

接着之前的部分来,老规矩,仅供学习研究,勿用于商业用途第二步:识别验证码图片缺口距离验证码图片还原将两张验证码背景图片(带缺口和不带缺口)下载到本地之后,可以看到它们大概长这个样子的:可以看到图片是被打乱了的,需要进一步还原图片的还原逻辑在slide.7.8.3.js里,混淆还原就不说了吧,第一部分里面有。关键逻辑我们可以通过追堆栈找到(这是下下策),想要快速定位的话,推荐hook或者搜索关键字,看看两种方式:hook:由于某验验证码是用canvas绘图的(F12查看验证码元素可以.
原创
发布博客 2021.08.31 ·
450 阅读 ·
3 点赞 ·
0 评论 ·
2 收藏

某验第三代滑动验证码分析(最新):第一部分

本案例仅用作学习研究,严禁商业用途!若本项目侵害了贵公司的权益,请及时联系我做相应处理。本案例用的官网滑块,2021-8-26可用,相关js版本:fullpage.9.0.7.js slide.7.8.3.js破解流程首先上一个滑动验证码通用的一个破解流程:获取验证码图片 -> 获取缺口距离 -> 生成轨迹并加密提交某验三代滑动验证也是同样的流程,只不过每个小流程下面细分步骤相对比较多,先说一下大致的一个过程:获取验证码图片请求register接口,拿到gt和cha.
原创
发布博客 2021.08.27 ·
1099 阅读 ·
6 点赞 ·
2 评论 ·
11 收藏

conda:Linux上的python虚拟环境迁移(离线)

conda:Linux上的python虚拟环境迁移(离线)在工作中,我们开发出来的程序往往还需要面临着部署的问题,而当我们要部署的机器没有网时????。。。离线环境下,最重要的就是尽可能保证我们程序的运行环境和开发环境一致,以确保程序能够正常运行。我平时习惯使用conda来安装python(真的方便,推荐安装miniconda,要小很多),之前在环境迁移的时候就是简单的把envs(通常是/root/miniconda3/envs)文件夹下的指定虚拟环境目录全部拷走,放在部署机上的同样位置。大多数情况
原创
发布博客 2021.03.15 ·
1939 阅读 ·
3 点赞 ·
0 评论 ·
11 收藏

python中使用json序列化datetime

python中使用json序列化datetime在python中使用json.dumps()时,是无法将datetime格式的数据转化成json的,会报如下错误:此时,我们需要为dumps()函数指定一个encoder:def json_encoder(obj): """提供给JSONEncoder的default方法,json将按要求格式化指定类型的对象""" if isinstance(obj, datetime.datetime): return obj.str
原创
发布博客 2021.03.04 ·
964 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

python实现驼峰式命名与下划线命名互相转换

import redef name_convert_to_camel(name: str) -> str: """下划线转驼峰""" contents = re.findall('_[a-z]+', name) for content in set(contents): name = name.replace(content, content[1:].title()) return namedef name_convert_to_snake(
原创
发布博客 2021.02.06 ·
5759 阅读 ·
5 点赞 ·
7 评论 ·
14 收藏

scrapy_redis分布式设置项

# 连接redisREDIS_URL = "redis://localhost:6379/0"# 指定去重类DUPEFILTER_CLASS = "scrapy_redis.dupefilter.RFPDupeFilter"# 指定调度器SCHEDULER = "scrapy_redis.scheduler.Scheduler"# 是否持久化(增量爬虫)SCHEDULER_PERS...
原创
发布博客 2019.03.23 ·
258 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python爬虫学习(3)增加访问量,自我安慰系列~

当我写出标题的时候,这篇博文就开始被我用做测试了。(源码)Github:https://github.com/OSinoooO/CSDN_readingCount_increase 昨天晚上看着自己写的博文,太低级了都没有人看呐   (┬_┬)突发奇想要不给自己增加一下阅读量,自我安慰一下?ヽ(-`Д´-)ノ想到就做,于是就开始了我的测试: 先弄清楚阅读量增加的机制...
原创
发布博客 2018.08.01 ·
3051 阅读 ·
2 点赞 ·
1 评论 ·
14 收藏

python爬虫学习(2)用tesserocr识别图像验证码

在学习爬虫的过程中难免会遇到验证码问题,作为纯自动化的爬虫是不可能手动去输入验证码的。那么我们就要学会怎么去识别它。而验证码也分很多种类,主要的几种:(1)图像验证码:这是最简单的一种,也很常见。就比如CSDN登录几次失败之后就会出验证码。(2)滑块验证码:需要按住滑块并移到正确的位置。比如bilibili的登录验证。(这个我也写过识别代码,源码托管github:https:/...
原创
发布博客 2018.07.31 ·
12541 阅读 ·
5 点赞 ·
11 评论 ·
70 收藏

Windows下Pycharm运行命令行语句结果乱码问题��Ȩ��Ӧ��

今天在学习python多线程的时候遇到了一个问题import subprocessprint('$ nslookup www.baidu.com')r = subprocess.call(['nslookup', 'www.baidu.com'])print('Exit code:', r)"$ nslookup www.baidu.com"语句相当于在cmd中输入:nslookup ww...
原创
发布博客 2018.06.15 ·
8678 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

python爬虫学习(1)爬取微软必应翻译(中英互译)

参考博客:https://blog.csdn.net/c406495762/article/details/59095864                 https://blog.csdn.net/weixin_42251851/article/details/80489403       本人属于python新手,刚学习的 python爬虫基础迫不及待地想试一试,看了论坛里大佬们写的在线翻译...
原创
发布博客 2018.06.12 ·
5412 阅读 ·
5 点赞 ·
2 评论 ·
15 收藏