自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 资源 (1)
  • 收藏
  • 关注

原创 字体反爬绕过

对于固定一种字体可以之间通过观察直接标记出各映射关系对于多种字体动态随机字体按以下流程:1. 下载字体文件2. 获取每个字符的轮廓数据(font['glyf'].get(w).coordinates.array)3. 获取每个字符的hash值4. 基准字形: 随便选取一种字体,获取每个字符的hash值并获取其映射关系。5. 将hash值与基准字符的hash值进行比较从而找到字符之间的映射。

2024-08-13 16:22:29 287

原创 简单使用pyppeteer模拟登录某乎

由于selenium使用较多,有些网页是可以检测到是否是使用了selenium,并且selenium所谓的保护机制不允许跨域cookies保存以及登录的时候必须先打开网页然后后加载cookies再刷新的方式很不友好。因此使用谷歌chrome官方无头框架puppeteer的python版本pyppeteer。

2023-12-06 17:44:48 1574 1

原创 python网页解析:xpath, css, bs4,pyquery

python 从网页中提取数据常用方法

2023-12-06 14:07:06 493 1

原创 python并发笔记

并发小笔记,仅记录大致方向,详细知识点可以看《流畅的Python》

2023-12-04 17:51:13 831

原创 Pandas:简单使用

df 添加一列是很快的,而添加一行需要copy,花费时间和内存很高,因此可以通过将数据先初始化为一个DataFrame对象,在进行合并。深拷贝:import copy;a = copy.deepcopy(b), a,b独立存在,值互不影响。多重行名常用于转换excel(excel中第一列只有一个值"Bob",而第二列对应多个值的情况)浅拷贝: a = b, 当b为可变对象时, b的值发生变化,a也会跟随变化。

2023-12-04 15:23:27 480

原创 Vim:简单使用

vim 的常用命令

2023-11-30 10:20:54 370

原创 Redis:简单使用

redis-py 3.0 放弃了对遗留“Redis”客户端类的支持。“StrictRedis”已更名为“Redis”,并提供一个名为“StrictRedis”的别名,以便之前使用“StrictRedis”的用户可以继续运行不变。

2023-11-27 17:16:47 581 1

原创 MongoDB: 简单使用

【代码】MongoDB: 简单使用。

2023-11-17 10:29:34 52 1

原创 MySql:简单使用

【代码】MySql:简单使用。

2023-11-16 16:35:47 45 1

原创 MongoDB:Error: couldn‘t connect to server 127.0.0.1:27017, connection attempt failed: SocketExceptio

创建进程成功则重新开一个Terminal,下mongo命令就好。

2023-11-06 09:44:04 1496

原创 Not implemented: HTMLCanvasElement.prototype.getContext (without installing the canvas npm package)

Not implemented: HTMLCanvasElement.prototype.getContext (without installing the canvas npm package)

2023-10-17 15:12:03 1589

原创 aqistudy空气质量检测网站python爬取

爬某空气质量网,详细流程。

2023-08-24 10:31:35 1548 1

原创 module ‘pyppeteer.launcher‘ has no attribute ‘AUTOMATION_ARGS‘

pyppeteer取消设置自动化参数报错:module 'pyppeteer.launcher' has no attribute 'AUTOMATION_ARGS'

2023-07-12 11:19:18 198 1

原创 消除div与页面之间的默认边距留白

去除div,css 页面之间的空白

2022-06-10 15:18:25 1118

Kernel-devel-headers-x86-64

Kernel-devel-headers-x86-64

2022-08-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除