- 博客(44)
- 收藏
- 关注
原创 python实现交互式(AcroForm类型)PDF内容提取
对于AcroForm格式的PDF,想要提取内容,python的pdfminer库可以实现。如下图,是一份确认单,为AcroForm类型的PDF。
2024-07-19 10:16:11 179
原创 python怎么实现正确的浮点数四舍五入
以下示例展示对于结构相同的两组数据(1.03575000和1.03425000)保留小数后4位,使用内置函数round方法的输出结果,并不是需要的结果。
2024-07-18 16:29:36 210
原创 python中pathlib相关操作
创建多级目录时,指定参数parents=True;当目录存在时指定参数exist_ok=True。只能删除空目录,删除目录不存在时报错。
2024-07-11 15:52:45 264
原创 python解析HTML(BeautifulSoup)
对象可以被当作一个方法来使用,这个方法的执行结果与调用这个对象的。参数同样接受不同类型的 过滤器 ,字符串,正则表达式,方法或。标签是当前子节点的直接父节点,所以可以被找到.还有一个。标签是目标子节点的间接父辈节点,所以也可以被找到.包含。的名字方法的简写.这个简写的原理就是多次调用当前。属性赋值,就相当于用当前的内容替代了原来的内容。相反,它指向当前被解析的对象的前一个解析对象。参数之后,只能查找直接子节点,这样就查不到。方法返回所有符合条件的后面的兄弟节点,方法返回所有符合条件的前面的兄弟节点,
2024-07-11 08:46:48 1035
原创 Python获取ofd格式发票信息
等文件就是一个压缩文件,是可以被解压处理的。所以获取发票信息的实现方法大致就是:先解压。文件获取到发票相关信息。格式文件,得到里面的。
2024-07-11 08:35:43 440
原创 python实现PDF转PNG
格式发票转为图片,找到以下方法,转换后的效果非常不错,特此记录在自己的笔记中,根据自己的需要,代码稍微有所优化修改。参考网址:https://zhuanlan.zhihu.com/p/102742847。
2024-07-11 08:33:23 159
原创 python如何提取word内的图片
docx文件其实也就是一个压缩文件,当我们将一个.docx文件直接解压后可以看到如下目录其中我们要找的图片就在word/media目录内,如图所以,要提取word内的图片就需要将.docx文件解压,再从media文件内取得图片,然后将解压后的文件删除。
2024-07-10 11:05:18 437
原创 python使用exchangelib读取、保存exchange邮件
【代码】python使用exchangelib读取、保存exchange邮件。
2024-07-10 10:58:48 246
原创 pandas常用方法之read_excel详解
指定表头的名称,list内的值跟表的列数要一一对应,即不能多也不能少,多或者少都会抛出ValueError错误: Number of passed names did not match number of header fields in the file。list类型时,元素即可以是int,也可以是str,如:[0, 1, 'Sheet3'],返回值是多个DataFrame的字典。值为str, 默认None。传入其余值时,只显示该值(包括)之前的行,超出行的长度后不报错,有多少行显示多少行。
2024-07-10 09:03:21 667
原创 使用pandas.to_html时怎么自定义表格样式
需要指定参数classes,该参数会在html代码中自动添加一个class</table>data = {"姓名": ["张三", "李四", "王五"], "年龄": [28, 24, 22], "城市": ["北京", "上海青浦区", "广州"]}# 使用自定义边框样式将DataFrame转换为HTML<style></style>"""# 将自定义的CSS和HTML表格组合在一起# # 打印或保存具有自定义边框样式的HTML表格。
2024-07-10 08:58:58 381
原创 pandas之groupby
1、单列聚合求平均,返回DataFramedf1 = df.groupby('分类', as_index=False)['价格'].mean()print(df1)'''0 水果 13.3333331 生鲜 8.0000002 肉类 30.000000'''# 2、单列聚合求和,返回DataFramedf2 = df.groupby('分类', as_index=False)['价格'].sum()print(df2)'''分类 价格0 水果 401 生鲜 24。
2024-07-10 08:58:20 125
原创 pandas之filter
过滤出列名为“订单号”和“订单编号”列 res_df = df . filter(items = [ "订单号" , '订单编号' ]) print(res_df) '''订单号 订单编号'''
2024-07-10 08:57:12 189
原创 用python实现多个表格合并后按指定字段去重后求和某一列
1、读取某文件夹中的N张报表(格式一致),将其合并为一张汇总表。源表格样式如下图:2、将合并后的表根据组合名称去重,并将其所对应的余额相加,最后将余额列单元格格式设置为会计专用(余额保留小数后两位,且余额为0时显示为-),用底红色高亮显示余额小于0的行。
2024-07-09 17:05:12 901
原创 python的xlrd模块读取Excel中自定义日期格式的单元格
经常使用python操作Excel,就会遇到各种坑,比如,有时候你读取到的某一单元格的数据,你预想的结果本来应该是这样的。造成此问题的原因就是该单元格的格式是自定义的日期格式,而非直接使用格式中的日期格式。如果是日期格式那么读取到的值应该是。进行格式化,针对自定义的类型,需要处理后才能转换使用,以下方法仅供参考。但是实际读到的内容它却是下图的样子,是一个整型。类型的,可以直接使用。
2024-07-09 16:57:34 395
原创 python打开Excel中指定的sheet表
保存关闭的,那下次打开就在原来的那个表的位置,所以有时候你想–在打开一个。如图:我最后保存的位置是“Sheet1”这个。那么我调用了下面的方法后,它会自动打开 分类。的时候指定到其中的一个。表,那么使用第三方库。
2024-07-09 16:55:07 574
原创 python读取Excel指定单元格的值
只支持xls(version > 2.x),既支持xls又支持xlsx(version < 2.x)只支持xlsx文件,不支持xls。
2024-07-09 16:49:29 286
原创 python读取Excel整列或整行数据
需注意xlrd的版本,只支持xls(version > 2.x),既支持xls又支持xlsx(version < 2.x)
2024-07-09 16:48:01 372
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人