
python
文章平均质量分 64
觅远
这个作者很懒,什么都没留下…
展开
-
Pandas库:(二)数组对象的索引
对于顺序数据(索引必须是单调递增或递减的),如时间序列或数值作为索引时,重建索引时会需要进行插值或填值处理,使用method参数进行设置。"backfill"和"bfill", 表示后项值填充;"ffill"和 "pad",表示前项值填充。默认的缺失值为nan,可通过fill_value参数指定自定义的缺失值。重建索引时,如果索引值不存在就会引入缺失值。原创 2025-02-19 16:31:50 · 77 阅读 · 0 评论 -
Pandas库:(一)数组对象的创建
Pandas是Python高效且强大的数据分析库。它是基于NumPy的数据分析模块,它提供了大量标准数据模型和高效操作大型数据集所需的工具。Pandas有:Series、DutaFrame和Panel三种数据结构。Series类似于数组,DataFrame类似于表格的二维数组,Panel可以视为Excel的多表单Sheet。方便测试,这里写两个方法用来产生随机列表和字典。原创 2025-02-19 15:42:05 · 161 阅读 · 0 评论 -
python+Ollama库实现简单的AI模型问答交互
安装ollama库:pip install ollama -i https://pypi.mirrors.ustc.edu.cn/simple/需要先在本地部署对应的模型。原创 2025-02-18 16:04:31 · 191 阅读 · 0 评论 -
Python+PIL:压缩图片
有时在发送一些文件如PPT、Word时,由于文件中的图片太大,导致文件也太大,无法发送,所有可以对文件中的图片进行压缩,下面代码根据用户自定义的目标大小(如30KB或40KB)进行压缩,并尽可能保证图片清晰度。:优先降低质量,避免不必要的缩放,减少清晰度损失。:在压缩后对图片进行锐化处理,进一步提升清晰度。重采样算法,保证缩放后的图片清晰度。原创 2025-02-12 16:59:09 · 197 阅读 · 0 评论 -
Python+spire.doc:读取Word文档内容
因为Word文档本质上是流式文档,流式布局,所以没有“页面”的概念。为了方便页面操作,Spire.Doc for Python提供了FixedLayoutDocument类,用于将Word文档转换为固定布局。Document.Sections[index] 属性可用于获取Word 文档中的特定节点。获取后,可遍历该节中的段落、表格等。可对查找的内容进行其他操作。原创 2025-02-12 15:52:00 · 329 阅读 · 0 评论 -
Python-pywin32库的使用
Beep()用于通过计算机的主板扬声器(或声卡模拟)发出指定频率和时长的蜂鸣声。与(播放系统预定义声音)不同,Beep()允许自定义声音的频率和持续时间。参数名类型描述frequencyint声音的频率(单位:赫兹,Hz)。37 Hz 到 32767 Hz。262 Hz (中音C)、440 Hz (标准音A)、1000 Hz (高频提示音)durationint声音的持续时间(单位:毫秒,ms)。正整数(如 500=0.5秒)。演示一段音符,# 定义音符频率和时长(毫秒)melody = [原创 2025-02-12 11:16:20 · 836 阅读 · 0 评论 -
Python+wxauto:实现电脑端微信程序自动化
wxauto库底层使用的是uiautomation框架,进行了封装处理。安装:pip install wxauto -i https://pypi.tuna.tsinghua.edu.cn/simple/原创 2025-02-10 17:46:37 · 2495 阅读 · 3 评论 -
python+playwright自动化测试(十):自动化脚本录制
录制命令示例:playwright codegen --target python -o E:\桌面\test_pro.py -b chromium https://www.baidu.com。原创 2025-02-10 14:10:25 · 291 阅读 · 0 评论 -
python内置库之getpass、msvcrt:密码安全输入(keyring+getpass、msvcrt实现密码安全管理)
中介绍了使用keyring库进行密码的安全存储,但是也提到keyring库的使用可能需要用户的交互,如在首次存储凭证时输入密码或修改密码时需要输入密码,这样会是密码暴露出来。所有我们可以使用Python的内置库getpass,这个模块是用来在终端(命令行界面)中安全地获取用户密码输入的。在用户输入密码时隐藏输入内容,从而增强了安全性。对于编写需要用户输入密码的程序非常有用。原创 2025-02-10 11:28:46 · 426 阅读 · 0 评论 -
python之keyring库:安全密码管理库,不同平台service_name、username的获取
keyring是一个Python库,它提供了一个简单的方法来访问系统的密钥管理服务,使得存储和检索敏感信息(如密码)变得更加安全和便捷。使用keyring库的好处之一是它抽象了底层密钥管理的细节,使得你的应用程序可以跨多个平台(如Windows、macOS、Linux等)一致地工作,而无需关心每个平台特定的密钥存储机制,方便测试及开发中的用户及密码管理。需要注意的是,keyring库的使用可能需要用户的交互(如在首次存储凭证时输入密码),这取决于底层的密钥管理服务实现。原创 2025-02-10 10:18:51 · 899 阅读 · 0 评论 -
adb命令对手机短信进行读取
Android的短信存储在content provider中,通常是content://sms/inbox。可根据短信的内容、发件人号码或时间戳来筛选短息。因此,ADB命令需要包含这些条件。例如,使用--where参数来指定条件,比如address='号码'或body LIKE '%关键词%'。通过调整--uri参数可操作不同短信箱(收件箱)(已发送)(草稿箱)content://sms/all (所有短信)content://sms/outbox 发件箱(尚未发送)原创 2025-02-08 17:26:05 · 406 阅读 · 0 评论 -
python+imbox实现邮件读取、附件下载、邮件删除
print(message.body['plain']) 输出结果是 Unicode 编码的字符串列表,而不是直接解析后的文本。返回的邮件正文内容可能是以列表形式存储的,并且可能包含 HTML 实体或 Unicode 编码。)将 Unicode 编码的字符串转换为可读文本。返回的是一个列表,你需要提取列表中的字符串。:如果邮件正文包含 HTML 实体(如。:使用 Python 的内置功能(如。可根据邮件内容或主题等进行标记。可根据邮件内容或主题等进行删除。原创 2025-02-08 14:15:52 · 331 阅读 · 0 评论 -
python+imaplib+email实现邮箱数据读取、附件下载、条件删除
可以根据条件如邮件标题、内容等进行邮件的删除操作,注意此删除操作是真删,删除后无法在已删除邮件中找到邮件。等),或者正文内容可能是 HTML 或纯文本的多部分结构。这个错误是因为邮件的正文内容可能不是 UTF-8 编码的文本,而是其他编码格式(如。需要遍历邮件的各个部分,找到合适的正文内容。如果没有明确指定编码,可以尝试常见的编码格式(如。:邮件的正文可能包含多种编码格式,需要根据邮件的。可指定邮件时间获取对应范围内容的邮件。库提供的工具安全地解码邮件正文。:邮件正文可能是多部分结构(如。原创 2025-02-08 11:28:50 · 893 阅读 · 0 评论 -
python+playwright自动化测试(九):expect断言和expect_xxx()元素及事件捕获
如果提供了谓词,则传递‘ Page ’值输入‘ predicate ’函数,并等待‘ predicate(event) ’返回一个真值。context.expect_event():指定事件触发时执行一个断言函数,并返回事件数据值。这些方法通常用在异步编程中,特别是在测试框架中,如pytest,可以帮助在测试期间等待特定的页面状态或元素状态。context.expect_console_message():执行操作并等待‘ ConsoleMessage ’在上下文中的页面中被记录。原创 2025-01-24 17:13:00 · 370 阅读 · 0 评论 -
python+playwright自动化测试(八):iframe切换、多窗口切换
context.add_cookies():将cookie添加到此浏览器上下文所在的所有页面中。context.grant_permissions():浏览器上下文的指定权限授权。context.clear_cookies():清除context的cookie。context.clear_permissions():清除授权。context.pages :获取context所有page对象。context.new_page():生成一个新的page对象。context.close():关闭context。原创 2025-01-24 10:49:12 · 377 阅读 · 0 评论 -
python+playwright自动化测试(七):同步与异步
异步需要导入from playwright.async_api import async_playwright,使用with async_playwright()创建上下文操作对象。代码中需要使用异步编程库asyncio中的async进行异步函数的定义,每个要执行的语句需要使用await关键字等待异步执行的结果返回。原创 2025-01-24 10:07:28 · 263 阅读 · 0 评论 -
python+playwright自动化测试(六):设置代理及网络监听和数据拦截修改
上面代码中使用了from functools import partial,解决事件监控时的函数传参问题,监控函数第一个传参为事件本身,如on_close中的event实际代表close。当然后面的网络拦截中也适用。修改响应数据通过使用 APIRequestContext 获取原始响应,然后将响应传递给 route.fulfill()。这种方式可以在不修改代码的情况下改变代理设置。中止请求使用route.abort()要在固定的上下文中使用代理,可以使用。原创 2025-01-23 16:53:24 · 273 阅读 · 0 评论 -
python+playwright自动化测试(四):元素操作(键盘鼠标事件)、文件上传
支持键盘按键,可执行的按键有Backquote, Minus, Equal, Backslash, Backspace, Tab, Delete, Escape,ArrowDown, End, Enter, Home, Insert, PageDown, PageUp, ArrowRight,ArrowUp, F1 - F12, Digit0 - Digit9, KeyA - KeyZ, etc。但输入结果有所不同,type()输入内容不会清除后输入,会在原来内容的基础上追加。通过循环输入可看出差异。原创 2025-01-22 16:11:35 · 611 阅读 · 0 评论 -
python+wave+pyaudio:调用电脑麦克风进行声音录制
wave:用于处理音频文件的读写操作。pyaudio:用于处理音频输入。原创 2025-01-20 15:44:29 · 138 阅读 · 0 评论 -
python+playwright自动化测试(三):事件等待机制
playwright中的timeout默认为30s,timeout=30000,有时需要根据具体情况进行自定义调整。原创 2025-01-17 16:41:40 · 766 阅读 · 0 评论 -
python+playwright自动化测试(二):元素定位与页面内容获取
官网:playwright同selenium一样,支持css、xpath等的元素方法定位。原创 2025-01-14 17:37:45 · 969 阅读 · 0 评论 -
python+playwright自动化测试(一):安装及简单使用,截图录屏
playwright是一个非常强大的自动化框架,支持Linux、Mac以及Windows操作系统操作,支持Chromium、Firefox、WebKit等主流浏览器自动化操作。官网:https://playwright.dev/安装playwright框架:pip install playwright安装浏览器驱动:playwright install ,可指定对应浏览器安装,如playwright install Chromium,不指定时安装默认的Chromium、Firefox、Webkit,原创 2025-01-14 12:01:41 · 733 阅读 · 0 评论 -
用python实现html转pdf:weasyprint、pdfkit
OSError: cannot load library 'libgobject-2.0-0': error 0x7e. Additionally, ctypes.util.find_library() did not manage to locate a library called 'libgobject-2.0-0',需要将gtk的bin添加到环境变量path中,或者使用os模块添加。在文件或字符串转pdf时,可通过css选项指定外部css文件,支持单个或多个css文件的添加。原创 2025-01-10 11:39:51 · 800 阅读 · 0 评论 -
python+fpdf:创建pdf并实现表格数据写入
fname=r'C:\Users\DELL\AppData\Local\JianyingPro\User Data\Cache\effect\9182767\56dfcfca94158a7a92263aa5b41f8a84-preview\Aa以梦为马.ttf')原创 2025-01-08 17:50:34 · 674 阅读 · 0 评论 -
python+pdfplumber:提取和分析PDF中的表格、文本等数据,实现pdf转图片、CSV、JSON、dict
安装:pip install pdfplumber -i https://pypi.tuna.tsinghua.edu.cn/simple/原创 2025-01-09 14:25:29 · 768 阅读 · 0 评论 -
python+PyMuPDF库:(三)pdf文件的选择性合并、其他格式文件转pdf
insert_file: 支持docx、xlsx、pdf、PPTX、txt、svg、xps、FB2、CBZ、EPUB、MOBI、HWPX、图片等多种格式的文件的插入。利用此方法可以将此类文件转为pdf格式的文件。# from_page,to_page 要截取的开始页和终止页,默认为-1,表示所有页。# start_at 要插入到某页,默认-1,表示最后一页。insert_pdf :用来打开pdf文件并插入。# rotate旋转角度。原创 2025-01-03 17:09:19 · 410 阅读 · 0 评论 -
python+reportlab创建PDF文件
reportlab库支持创建包含文本、图像、图形和表格的复杂PDF文档。安装:pip install reportlab -i https://pypi.tuna.tsinghua.edu.cn/simple。原创 2024-12-25 14:56:40 · 749 阅读 · 0 评论 -
python+PyPDF2实现PDF的文本内容读取、多文件合并、旋转、裁剪、缩放、加解密、添加水印
安装:pip install PyPDF2 -i https://pypi.tuna.tsinghua.edu.cn/simple。原创 2024-12-24 11:51:32 · 514 阅读 · 0 评论 -
python实现Excel转图片
安装:pip install spire.xls -i https://pypi.tuna.tsinghua.edu.cn/simple。安装:pip install excel2img -i https://pypi.tuna.tsinghua.edu.cn/simple。支持选择行和列截图,不好的一点就是商业库,转出来的图片有水印。原创 2024-12-19 16:49:01 · 642 阅读 · 0 评论 -
python实现word转html
mammoth库支持将word转为HTML和markdown格式的文件。强大的word文件处理库,不太好的就是商业库转换出的文件有水印。原创 2024-12-19 11:09:39 · 583 阅读 · 0 评论 -
python+spire.doc:word文档转图片(精彩部分:解决spire.doc生成固定水印无法去除的问题)、文件编码格式获取
安装库:pip install spire.doc -i https://pypi.tuna.tsinghua.edu.cn/simple使用spire.doc库将word转图片后产生水印文字:Evaluation Warning: The document was created with Spire.Doc for Python.原因是商业库,需要购买官方许可证。这点难不倒爱创新的我!!原创 2024-12-12 15:57:44 · 974 阅读 · 0 评论 -
python+img2pdf 快速图片转pdf+(img2pdf.ExifOrientationError处理、文件被打开或占用报错处理)
使用命令行参数--rotation=ifvalid来指示img2pdf在遇到无效旋转值时采取合适的行动。自动修正所有有效的旋转值的参数rotation=img2pdf.Rotation.ifvalid 或 --rotation=ifvalid。img2pdf 无法将图片按照指定大小添加到pdf中,会出现生成的pdf中每张图片都是原始图片的大小,但是可以使用其他库将图片统一修改成指定大小后再生成pdf,如和PIL库结合使用,调整图片大小或旋转图片等操作,生成新的图片后再添加到pdf中。原创 2024-12-11 14:03:43 · 625 阅读 · 0 评论 -
pdf转图片
安装依赖包特多,基本都会失败,使用镜像源安装:pip install python-office -i https://pypi.tuna.tsinghua.edu.cn/simple。PyMuPDF 还提供了丰富的功能来操作PDF文件,如读取、写入、分割、合并、旋转、裁剪等。此外,它还支持加密和解密PDF文档,以及提取文本、图像和元数据等信息。下载解压后将bin文件路径添加到环境变量path中,添加完成后命令行窗口输入pdftotext -v 可查看是否安装成功,安装成功后有版本信息。原创 2024-12-10 15:34:53 · 594 阅读 · 0 评论 -
python+docx+docx2python:多文件合并,提取docx文件文本、表格及图片数据
安装库:docx2python库支持快速提取文本内容和图片等数据,包含页眉页脚数据。原创 2024-12-05 16:11:48 · 385 阅读 · 0 评论 -
python+docx:(二)页眉页脚、表格操作
合并单元格,使用单元格对象的merge方法,起始单元格.merge(终止单元格对象)页眉页脚操作需要访问文件的section,可通过添加页脚来添加页码。支持追加的方式创建内容(.add_run())通过循环的方式合并某一行或某一列的操作。测试打印所有表格样式。官方预定义样式的取值。原创 2024-11-28 15:51:05 · 351 阅读 · 0 评论 -
python+docx:(一)页、标题、段落、图片操作
安装:pip install python-docx1、docx中设置尺寸width或height时,需要使用 Inches,Cm 【英寸、厘米】等才能生效,更多见docx.shared脚本库2、对齐方式:alignment,需要from docx.enum.text import WD_PARAGRAPH_ALIGNMENT3、Word 中一般可以结构化成三个部分:文档 Document、段落 Paragraph、文字块 Run。原创 2024-11-25 18:07:49 · 568 阅读 · 1 评论 -
python+pptx:(三)添加统计图、删除指定页
python+pptx:添加统计图、删除指定页原创 2024-11-08 15:50:23 · 1077 阅读 · 0 评论 -
python+pptx:(二)添加图片、表格、形状、模版渲染
模版渲染,简单使用,可以通过提取占位符或文本内容处理数据,下面演示通过处理文本内容替换数据操作。原创 2024-11-08 13:53:48 · 628 阅读 · 0 评论 -
python-读写Excel:openpyxl-(4)下拉选项设置
接收两个公式参数时,可选择operator参数,参数可选值有:"between", "notBetween", "equal", "notEqual", "lessThan", "lessThanOrEqual", "greaterThan", "greaterThanOrEqual"。DataValidation可接收两个公式参数formula1 和formula12 ,根据不同的type添加一个或两个公式参数,如果type类型只接收一个公式时,则取formula1为公式。原创 2024-11-05 18:04:15 · 726 阅读 · 0 评论 -
python+pptx:(一)占位符、文本框、段落操作
安装三方库:pip install python-pptx。原创 2024-10-31 17:32:43 · 806 阅读 · 0 评论