- 博客(14)
- 资源 (1)
- 收藏
- 关注
原创 字体反爬绕过
对于固定一种字体可以之间通过观察直接标记出各映射关系对于多种字体动态随机字体按以下流程:1. 下载字体文件2. 获取每个字符的轮廓数据(font['glyf'].get(w).coordinates.array)3. 获取每个字符的hash值4. 基准字形: 随便选取一种字体,获取每个字符的hash值并获取其映射关系。5. 将hash值与基准字符的hash值进行比较从而找到字符之间的映射。
2024-08-13 16:22:29 287
原创 简单使用pyppeteer模拟登录某乎
由于selenium使用较多,有些网页是可以检测到是否是使用了selenium,并且selenium所谓的保护机制不允许跨域cookies保存以及登录的时候必须先打开网页然后后加载cookies再刷新的方式很不友好。因此使用谷歌chrome官方无头框架puppeteer的python版本pyppeteer。
2023-12-06 17:44:48 1574 1
原创 Pandas:简单使用
df 添加一列是很快的,而添加一行需要copy,花费时间和内存很高,因此可以通过将数据先初始化为一个DataFrame对象,在进行合并。深拷贝:import copy;a = copy.deepcopy(b), a,b独立存在,值互不影响。多重行名常用于转换excel(excel中第一列只有一个值"Bob",而第二列对应多个值的情况)浅拷贝: a = b, 当b为可变对象时, b的值发生变化,a也会跟随变化。
2023-12-04 15:23:27 480
原创 Redis:简单使用
redis-py 3.0 放弃了对遗留“Redis”客户端类的支持。“StrictRedis”已更名为“Redis”,并提供一个名为“StrictRedis”的别名,以便之前使用“StrictRedis”的用户可以继续运行不变。
2023-11-27 17:16:47 581 1
原创 MongoDB:Error: couldn‘t connect to server 127.0.0.1:27017, connection attempt failed: SocketExceptio
创建进程成功则重新开一个Terminal,下mongo命令就好。
2023-11-06 09:44:04 1496
原创 Not implemented: HTMLCanvasElement.prototype.getContext (without installing the canvas npm package)
Not implemented: HTMLCanvasElement.prototype.getContext (without installing the canvas npm package)
2023-10-17 15:12:03 1589
原创 module ‘pyppeteer.launcher‘ has no attribute ‘AUTOMATION_ARGS‘
pyppeteer取消设置自动化参数报错:module 'pyppeteer.launcher' has no attribute 'AUTOMATION_ARGS'
2023-07-12 11:19:18 198 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人