Python
文章平均质量分 79
冰__蓝
这个作者很懒,什么都没留下…
展开
-
PngImagePlugin.py 日志打印问题
PIL.PngImagePlugin.py 脚本日志打印信息问题原创 2022-10-19 14:55:17 · 1135 阅读 · 1 评论 -
Python处理PDF——PyMuPDF中图像的使用(2)
文章目录1、从文档页面生成图像page.get_pixmap()参数2、提升图像分辨率3、创建部分像素贴图(`Clips`)4、PDF文档提取图像如何获取`xref`的值呢?本文记录PyMuPDF库中有关Image的使用方法关于PyMuPDF库的安装、介绍及基本使用可参考博客:Python处理PDF——PyMuPDF的安装与使用(1)_ling620的专栏-CSDN博客1、从文档页面生成图像这个脚本将获取一个文档文件名,并将每个页面生成一个PNG文件保存在脚本目录中。文档可以是任何受支持的类原创 2021-09-01 17:34:16 · 16092 阅读 · 4 评论 -
Python处理PDF——PyMuPDF的安装与使用(1)
文章目录1、`PyMuPDF`简介1. 资料链接2. 介绍3. 功能2、安装关于命名`fitz`的说明3、使用方法1. 导入库,查看版本2. 打开文档3. Document的方法和属性4. 获取元数据5. 获取目标大纲6. 页面(`Page`)a. 检查页面的链接、批注或表单字段b. 呈现页面c. 将页面图像保存到文件中d. 提取文本和图像e. 搜索文本7. PD操作a. 修改、创建、重新排列和删除页面b. 连接和拆分PDF文档c. 保存d. 关闭1、PyMuPDF简介1. 资料链接github地原创 2021-09-01 15:30:01 · 23930 阅读 · 8 评论 -
pdf文件转图片的两种方法
文章目录1、借助`PyMuPDF`库1)安装2)查看版本3)常用接口4)将`pdf`转为图片实例2、基于`pdfplumber`库1)安装2)常用接口3)实例本文主要记录几种pdf文件转为图片的几种方法,方便日后使用。1、借助PyMuPDF库可以将页面呈现为光栅或矢量(SVG)图像,可以选择缩放、旋转、移动或剪切页面。1)安装pip install PyMuPDF2)查看版本import fitzprint(fitz.__doc__)3)常用接口打开pdf文件,或者创建p原创 2021-08-31 16:16:16 · 5011 阅读 · 1 评论 -
安装Numba: Failed building wheel for llvmlite
该文章记录在安装numba库时,所出现的错误,以及解决方法!1. 问题描述新配了一台服务器,在配置项目环境的时候,需要安装numba库,之前从来没有关注过,一般都是直接使用pip3 install numba进行安装。但这次使用pip3进行安装的时候,出现了以下错误:根据上图,可以看出错误信息是因为编译llvmlite失败,提到无法找到llvm-config。===>开始百度,随后发现如下几篇文章:安装llvmlite报错解决:RuntimeError: llvm-config f.原创 2021-04-23 18:22:30 · 11689 阅读 · 4 评论 -
Python浮点数四舍五入问题的分析与解决方法
1、问题昨天遇到一个问题,在 6.6045 保留三位小数时,使用 round() 函数进行计算,我们希望得到 6.605,然而:>>>round(6.6045,3)6.604网上有人说,因为在计算机里面,小数是不精确的,例如 1.115 在计算机中实际上是 1.114999999999999991182,所以当你对这个小数精确到小数点后两位的时候,实际上小数点后第三位是 4,所以四舍五入,结果为 1.11.这种说法,对了一半。因为并不是所有的小数在计算机中...转载 2020-10-15 17:21:48 · 1795 阅读 · 0 评论 -
python ftplib模块实现文件上传下载
当前需求:从FTP服务器上下载文件到本机,处理完成后,再把结果上传至FTP服务器指定路径下。一、ftplib模块–FTP协议客户端Python中默认安装的ftplib模块定义了FTP类,可以用来实现简单的ftp客户端,实现上传、下载文件功能。说明手册: ftplib — FTP protocol client — Python 3.5.9 documentation1、FTP类及其方法class FTP(host='', user='', passwd='', acct='', timeout.原创 2020-06-19 18:03:31 · 4780 阅读 · 0 评论 -
【Python】—日志模块logging详解 多进程日志记录
文章目录1、 问题描述2、 分析2.1 `logging`模块实现日志回滚2.2 多进程日志安全输出到同一文件方案3、解决方案3.1 使用`ConcurrentRotatingFileHandler`包3.2 对日志输出加锁3.3 重写`FileHandler`类3.4 单独进程负责日志事件3.5 `logging.SocketHandler`的方案4、参考文献1、 问题描述项目中,使用Rot...原创 2020-01-06 18:12:55 · 5223 阅读 · 1 评论 -
【Python】日志模块logging使用详解2
文章目录一、小总结二、Logger对象的日志等级三、使用多个处理器和多种格式化四、日志回滚1. RotatingFileHandler2. TimedRotatingFileHandler五、RotatingHandler存在的问题六、从多个进程记录至单个文件本文作为Python日志模块的补充,主要介绍日志回滚RotatingFileHandler和TimedRotatingFileHandl...原创 2020-01-03 18:34:36 · 672 阅读 · 0 评论 -
Python 字符串前加r,b,u
目录问题描述1、字符串前加字母`u`2、字符串前加字母`r`3、字符串前加字母`b`问题描述在处理python代码的时候,经常可以看到字符串的前面有u, b, 或r字母,如下图所示:b'2019:12:26 07:52:16'加上这些字母有什么意义呢?1、字符串前加字母u作用: u表示将后面跟的字符串以unicode格式进行编码常用在含有中文的字符串前面(不仅针对中文,可以跟任何字...原创 2019-12-31 13:01:18 · 1147 阅读 · 0 评论 -
图像元数据(Metadata) ——Exif信息分析
文章目录1、元数据1. 图片元数据2. 如何查看元数据2、图像Exif信息2.1 简介2.1 JPG文件结构2.2 Exif与TIFF的关系2.3 Exif元数据2.4 总结3、Exif工具3.1 Pillow库3.2 exiv23.3 exifread库3.4 piexif库4、Exif记录的信息(标签)参考文献1、元数据元数据(Matedata),又称中介数据、中继数据,为描述数据的数据(...原创 2019-12-27 17:54:52 · 18310 阅读 · 2 评论 -
kmcuda: GPU加速 Kmeans
文章目录1、kmcuda简介2、安装1. 查询gcc版本2. 查询GPU算力3. 配置GPU路径3、完整安装命令4、安装遇到的问题1. 使用pip安装2. 未指定GPU算力或使用默认值5、Python测试用例1. K-means, L2 (Euclidean) distance2. K-means, angular (cosine) distance + average6、Python API1....原创 2019-09-25 17:20:00 · 4968 阅读 · 4 评论 -
机器学习:Python实现聚类算法(一)之K-Means
转自机器学习:Python实现聚类算法(一)之K-Means - lc19861217 - 博客园1. 简介K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。2. 算法大致流程为:1)随机选取k个点作为种子点(...转载 2019-08-27 16:23:00 · 938 阅读 · 0 评论 -
Python -m 参数
文章目录查看解释模块和脚本使用查看解释-m: run library modules as a script 将模块当做脚本运行。模块和脚本在python中,模块,就是一个由代码组成的普通脚本文件。通常会提供一些函数或者类。我们在调用模块中的函数或类时,通过import <module>导入使用。当我们引入模块的时候,并不会导入模块中的__main__函数。在文件内部,一...原创 2019-08-20 09:45:55 · 1656 阅读 · 0 评论 -
【Python】—日志模块logging使用详解1
文章目录1、日志级别2、logging流程3、日志输出形式4、基本使用部署项目时,不可能将所有的信息都输出到控制台中,因此我们将这些信息记录到日志文件中,不仅方便查看程序运行的情况,也可以在项目出现故障时根据该运行时产生的日志快速定位问题。1、日志级别Python标准库logging用做记录日志,默认分为六种日志级别:NOTEST(0)DEBUG(10)INFO(20)WARNIN...原创 2020-01-02 17:18:35 · 3138 阅读 · 0 评论 -
simHash介绍及python实现
文章目录1、simHash简介2、simHash具体流程3、Python实现simHash1、simHash简介simHash算法是GoogleMoses Charikear于**年发布的一篇论文《Detecting Near-duplicates for web crawling》中提出的, 专门用来解决亿万级别的网页去重任务。simHash是局部敏感哈希(locality sensitv...原创 2019-07-12 11:49:30 · 8784 阅读 · 2 评论 -
Python基本数据类型——tuple, set
tuple下标注意: a[-1::-1] 表示从-1即倒数第一个元素开始,直到…,其中第二个:-1表示间隔是-1个元素,即从后往前,相当于对a的元素进行倒序a = list(range(10))# a [0,1,2,3,4,5,6,7,8,9]print(a[-2:-5:-1])8,7,6print(a[-2:-5])[]print(a[-1::-1]) # 倒叙9,...原创 2019-07-07 01:00:19 · 266 阅读 · 0 评论 -
Windows系统启动python报文件编码错误
问题描述在anaconda环境中启动python,出现如下错误:(base) D:\>pythonPython 3.7.3 (default, Mar 27 2019, 17:13:21) [MSC v.1915 64 bit (AMD64)] :: Anaconda, Inc. on win32Type "help", "copyright", "credits" or "lice...原创 2019-07-04 21:36:46 · 803 阅读 · 1 评论