自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

cnblogs_user的博客

日常记录

  • 博客(44)
  • 收藏
  • 关注

原创 python实现交互式(AcroForm类型)PDF内容提取

对于AcroForm格式的PDF,想要提取内容,python的pdfminer库可以实现。如下图,是一份确认单,为AcroForm类型的PDF。

2024-07-19 10:16:11 179

原创 python怎么实现正确的浮点数四舍五入

以下示例展示对于结构相同的两组数据(1.03575000和1.03425000)保留小数后4位,使用内置函数round方法的输出结果,并不是需要的结果。

2024-07-18 16:29:36 210

原创 python使用win32gui操作窗口

【代码】python使用win32gui操作窗口。

2024-07-18 16:28:43 537

原创 python中pathlib相关操作

创建多级目录时,指定参数parents=True;当目录存在时指定参数exist_ok=True。只能删除空目录,删除目录不存在时报错。

2024-07-11 15:52:45 264

原创 Python切换中英文输入法

系统必须要有中文语言和英文语言,才能实现输入法(语言)切换。要实现中英文切换,首先。

2024-07-11 15:49:57 500

原创 python解析HTML(BeautifulSoup)

对象可以被当作一个方法来使用,这个方法的执行结果与调用这个对象的。参数同样接受不同类型的 过滤器 ,字符串,正则表达式,方法或。标签是当前子节点的直接父节点,所以可以被找到.还有一个。标签是目标子节点的间接父辈节点,所以也可以被找到.包含。的名字方法的简写.这个简写的原理就是多次调用当前。属性赋值,就相当于用当前的内容替代了原来的内容。相反,它指向当前被解析的对象的前一个解析对象。参数之后,只能查找直接子节点,这样就查不到。方法返回所有符合条件的后面的兄弟节点,方法返回所有符合条件的前面的兄弟节点,

2024-07-11 08:46:48 1035

原创 python实现图片转PDF

为了使转换后的图片以正常比例显示在。中,对图片进行了缩放处理。

2024-07-11 08:40:30 169

原创 python解析发票二维码(图片)

通过发票左上角的二维码信息,获取发票的关键信息,只需将图片格式的电子发票或扫描后的发票图片传入即可.

2024-07-11 08:38:30 328

原创 python实现两张图片拼接

【代码】python实现两张图片拼接。

2024-07-11 08:37:27 191

原创 Python获取ofd格式发票信息

等文件就是一个压缩文件,是可以被解压处理的。所以获取发票信息的实现方法大致就是:先解压。文件获取到发票相关信息。格式文件,得到里面的。

2024-07-11 08:35:43 440

原创 python实现PDF转PNG

格式发票转为图片,找到以下方法,转换后的效果非常不错,特此记录在自己的笔记中,根据自己的需要,代码稍微有所优化修改。参考网址:https://zhuanlan.zhihu.com/p/102742847。

2024-07-11 08:33:23 159

原创 python实现PDF指定页面旋转

PyPDF2下面示例代码,是将横向纸张旋转为纵向(根据纸张大小判断纸张方向)

2024-07-11 08:32:26 274

原创 python往已有内容的PDF文件写入数据

库好像没法在已经有内容的PDF页面中写入数据,只能生成一个空的PDF文件再写入。

2024-07-11 08:31:15 389

原创 python在PDF文件指定的文字下划线

【代码】python在PDF文件指定的文字下划线。

2024-07-11 08:30:18 333

原创 CentOS7配置yum源

【代码】CentOS7配置yum源。

2024-07-11 08:28:48 174

原创 python如何实现对word内段落文本及表格的读取

在以下方法中用到的三方库是:python-docx。

2024-07-10 11:08:12 415

原创 python如何提取word内的图片

docx文件其实也就是一个压缩文件,当我们将一个.docx文件直接解压后可以看到如下目录其中我们要找的图片就在word/media目录内,如图所以,要提取word内的图片就需要将.docx文件解压,再从media文件内取得图片,然后将解压后的文件删除。

2024-07-10 11:05:18 437

原创 python在Word文件指定的文字下划线

【代码】python在Word文件指定的文字下划线。

2024-07-10 11:01:02 458

原创 python使用exchangelib读取、保存exchange邮件

【代码】python使用exchangelib读取、保存exchange邮件。

2024-07-10 10:58:48 246

原创 python提取.msg邮件的附件

msg文件,outlook邮件的一种保存方式。

2024-07-10 10:57:42 278

原创 python发送、接收exchange邮件

【代码】python发送、接收exchange邮件。

2024-07-10 10:54:31 380

原创 python解析提取.eml邮件内容及附件

【代码】python解析提取.eml邮件内容及附件。

2024-07-10 10:53:59 494

原创 python获取上月、当月、下月的开始和结束日期

【代码】python获取上月、当月、下月的开始和结束日期。

2024-07-10 09:09:09 482

原创 python获取当前季度或上一季度的起止日期

【代码】python获取当前季度或上一季度的起止日期。

2024-07-10 09:07:36 181

原创 pandas常用方法之read_excel详解

指定表头的名称,list内的值跟表的列数要一一对应,即不能多也不能少,多或者少都会抛出ValueError错误: Number of passed names did not match number of header fields in the file。list类型时,元素即可以是int,也可以是str,如:[0, 1, 'Sheet3'],返回值是多个DataFrame的字典。值为str, 默认None。传入其余值时,只显示该值(包括)之前的行,超出行的长度后不报错,有多少行显示多少行。

2024-07-10 09:03:21 667

原创 pandas合并两个df数据(数据互补)

【代码】pandas结合两个df数据(数据互补)

2024-07-10 09:01:06 173

原创 使用pandas.to_html时怎么自定义表格样式

需要指定参数classes,该参数会在html代码中自动添加一个class</table>data = {"姓名": ["张三", "李四", "王五"], "年龄": [28, 24, 22], "城市": ["北京", "上海青浦区", "广州"]}# 使用自定义边框样式将DataFrame转换为HTML<style></style>"""# 将自定义的CSS和HTML表格组合在一起# # 打印或保存具有自定义边框样式的HTML表格。

2024-07-10 08:58:58 381

原创 pandas之groupby

1、单列聚合求平均,返回DataFramedf1 = df.groupby('分类', as_index=False)['价格'].mean()print(df1)'''0 水果 13.3333331 生鲜 8.0000002 肉类 30.000000'''# 2、单列聚合求和,返回DataFramedf2 = df.groupby('分类', as_index=False)['价格'].sum()print(df2)'''分类 价格0 水果 401 生鲜 24。

2024-07-10 08:58:20 125

原创 pandas之query

=!

2024-07-10 08:57:45 208

原创 pandas之filter

过滤出列名为“订单号”和“订单编号”列 res_df = df . filter(items = [ "订单号" , '订单编号' ]) print(res_df) '''订单号 订单编号'''

2024-07-10 08:57:12 189

原创 用python实现多个表格合并后按指定字段去重后求和某一列

1、读取某文件夹中的N张报表(格式一致),将其合并为一张汇总表。源表格样式如下图:2、将合并后的表根据组合名称去重,并将其所对应的余额相加,最后将余额列单元格格式设置为会计专用(余额保留小数后两位,且余额为0时显示为-),用底红色高亮显示余额小于0的行。

2024-07-09 17:05:12 901

原创 python的xlrd模块读取Excel中自定义日期格式的单元格

经常使用python操作Excel,就会遇到各种坑,比如,有时候你读取到的某一单元格的数据,你预想的结果本来应该是这样的。造成此问题的原因就是该单元格的格式是自定义的日期格式,而非直接使用格式中的日期格式。如果是日期格式那么读取到的值应该是。进行格式化,针对自定义的类型,需要处理后才能转换使用,以下方法仅供参考。但是实际读到的内容它却是下图的样子,是一个整型。类型的,可以直接使用。

2024-07-09 16:57:34 395

原创 python中使用to_excel时如何不覆盖原有数据来新建sheet页

方法会自动覆盖源文件,在源文件中新增。

2024-07-09 16:57:00 497

原创 python中使用to_excel时如何不覆盖原有数据来新建sheet页

方法会自动覆盖源文件,在源文件中新增。

2024-07-09 16:56:29 498

原创 python利用xlwings写入一行或一列Excel数据

【代码】python利用xlwings写入一行或一列Excel数据。

2024-07-09 16:55:55 893

原创 python打开Excel中指定的sheet表

保存关闭的,那下次打开就在原来的那个表的位置,所以有时候你想–在打开一个。如图:我最后保存的位置是“Sheet1”这个。那么我调用了下面的方法后,它会自动打开 分类。的时候指定到其中的一个。表,那么使用第三方库。

2024-07-09 16:55:07 574

原创 python实现WPS文件转PDF

【代码】python实现WPS文件转PDF。

2024-07-09 16:53:11 512

原创 python读取Excel指定单元格的值

只支持xls(version > 2.x),既支持xls又支持xlsx(version < 2.x)只支持xlsx文件,不支持xls。

2024-07-09 16:49:29 286

原创 python读取Excel整列或整行数据

需注意xlrd的版本,只支持xls(version > 2.x),既支持xls又支持xlsx(version < 2.x)

2024-07-09 16:48:01 372

原创 python实现Excel中设置超链接

Excelcell。

2024-07-09 16:46:14 886

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除