Python Reptile(爬虫)
文章平均质量分 90
Python Reptile(爬虫)
Dontla
Life is short, I use AI.
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
playwright有头模式必需图形界面环境吗?(Windows macOS原生支持、Linux服务器需要虚拟显示Xvfb、Docker容器需要特殊配置、X11转发、VNC远程桌面)
有头模式的核心要求是:图形显示能力,而非特定操作系统。✅Windows、macOS、Linux桌面:原生支持,开箱即用⚠️Linux服务器、Docker、云服务器:需要额外配置图形环境💡最佳实践:开发用有头,生产用无头,灵活切换记住,有头模式是为了"看到"浏览器窗口,而不是"必须在Windows上运行"。只要环境能提供图形显示能力,任何平台都可以运行有头模式!原创 2026-04-07 12:56:10 · 444 阅读 · 0 评论 -
Playwright无头模式在内存虚拟渲染UI,从内存提取像素数据(无头浏览器、离屏渲染Off-screen Rendering、headless、Chromium、Skia图形库、Blink引擎
✅完整渲染引擎:Blink渲染引擎完整工作✅内存渲染:渲染结果输出到内存缓冲区而非显示器✅像素提取:从内存缓冲区直接提取像素数据✅格式转换:将像素数据编码为PNG/JPEG等格式✅性能优势:省略了显示到屏幕的步骤,速度更快所以,无头浏览器不是"没有渲染",而是"渲染但不显示"。这就像一个画家在画室里作画,画完后不把画挂在墙上展览,而是直接拍照保存——画作本身是完整存在的,只是观众看不到作画过程而已。🎨。原创 2026-04-07 12:47:45 · 471 阅读 · 0 评论 -
Playwright有头模式Headed Mode(正常显示UI界面)与无头模式Headless Mode(浏览器在后台运行)介绍
在深入讨论模式之前,让我们快速了解一下Playwright。Playwright是一个Node.js库,用于自动化Chromium、Firefox和WebKit浏览器。跨浏览器自动化网络拦截和模拟文件下载/上传视频录制移动设备模拟多语言支持(JavaScript/TypeScript、Python、Java、C#)有头模式是指浏览器以可见的图形界面运行,用户可以看到浏览器窗口、页面加载过程和所有操作步骤。这种模式下,浏览器会正常显示UI界面,就像普通用户使用浏览器一样。原创 2026-04-07 12:29:31 · 772 阅读 · 0 评论 -
python 从字符串中提取数字 re.findall()
以前老用(.*?)提取数字,今天发现不对了,比如一行数字为:0 0.248438 0.255556 0.128125 0.194444用:re.findall('(.*?) (.*?) (.*?) (.*?) (.*?)', line)去提取,就会漏掉最后一个数字,变成:[('0', '0.248438', '0.255556', '0.128125', '')]也不知是为啥...原创 2020-02-16 15:05:34 · 6301 阅读 · 0 评论 -
python 文件操作 os 如何检索文件夹内文件数量
参考文章1:python os获取文件夹中文件夹内文件的数量,保存为CSV文件参考文章2:用python计算大文件夹下小文件夹里文件的个数原创 2019-10-23 15:33:58 · 1671 阅读 · 0 评论 -
python 正则表达式 re (.*?)和(.*)的区别(贪婪模式&非贪婪模式)惰性匹配
1. 匹配任意除换行符“\n”外的字符;2. *表示匹配前一个字符0次或无限次;3. +或*后跟?表示非贪婪匹配,即尽可能少的匹配,如*?重复任意次,但尽可能少重复;4. .*? 表示匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。如:a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab和ab。引用文章:正则表达式(.*?)惰...原创 2019-10-23 13:13:45 · 4466 阅读 · 0 评论 -
python 文件操作 os.read() 方法 读文本文件 读取文字
引用文章:Python3 os.read() 方法原创 2019-10-23 10:59:39 · 1925 阅读 · 0 评论 -
python 文件操作 os.readlines()函数用法
引用文章:Python File readlines() 方法原创 2019-10-23 10:51:05 · 1879 阅读 · 0 评论 -
python 文件操作 os.readline()函数用法
引用文章:Python File readline() 方法原创 2019-10-23 10:48:23 · 2055 阅读 · 0 评论 -
python 正则表达式 re.findall()方法
from 《Python 爬虫开发 从入门到实战》谢乾坤pattern表示正则表达式,string表示原来的字符串,flags表示一些特殊功能的标志。findall的结果是一个列表,包含了所有匹配到的结果。如果没有匹配到结果,就会返回空列表。from re.pydef findall(pattern, string, flags=0): """Return a list of al...原创 2019-10-23 10:07:34 · 917 阅读 · 0 评论
分享