![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python自动化办公
牧文山
这个作者很懒,什么都没留下…
展开
-
判断多个文件夹的文件名某些字段
判断多个文件夹的文件名是否包含“分公司”和“营销中心”原创 2023-09-18 22:35:13 · 90 阅读 · 0 评论 -
Python读取Word统计词频输出到Excel
"# 输出到excel\n",2.读取docx文件到一个大字符串。"# 中英文分词\n",# 过滤标点符号,无意义的单个字。5. 构造pandas并且排序。"# 读取docx\n",将list转化为dict。原创 2023-08-13 15:43:53 · 753 阅读 · 0 评论 -
Python比较两个txt文件是否相同,去掉重复内容写入到另一个txt文件
#!/usr/bin/env python# -*- coding:utf-8 -*-def file_same(): str1 = [] file1 = open("test.txt", "r", encoding="utf-8") for line in file1.readlines(): # 读取第一个文件 str1.append(line.replace("\n", "")) str2 = [] file2 = open("tes.原创 2022-05-12 19:29:01 · 2618 阅读 · 8 评论 -
python批量添加多个txt文件前缀
import os# 原txt文件路径txt_file_path = r'D:\File\文本'# 修改后的txt文件路径save_file_path = r'D:\File\新建文件夹'total_txt = os.listdir(txt_file_path)num = len(total_txt)s = """ 这里是需要添加的内容."""i = 0for each in total_txt: with open(txt_file_path+'/'+str(ea.原创 2022-05-04 10:16:11 · 965 阅读 · 0 评论 -
python批量解密PDF文件
用解密PDF pdf_reader.decrypy(密码)总会报错。NotImplementedError: only algorithm code 1 and 2 are supported原因就在于:1)这个被加密的pdf可能是从高版本的acrobot中来的,所以对应的加密算法代号为‘4’2)然而,现有的pypdf2模块并只支持加密算法代号为‘1’或者‘2’的pdf加密文件,所以才会报这样的错。这里我们采用更高级的pickpdf库来解密。import pikepdfpdf = pike原创 2022-04-20 19:56:59 · 1606 阅读 · 2 评论 -
python批量pdf转png
首先安装对应的库:pip install fitzpip install PyMuPDF代码如下:import sys, fitzimport os# 忽略警告import warningswarnings.filterwarnings("ignore")def pdf2image(pdfPath, imgPath, zoom_x, zoom_y, rotation_angle): # zoom_x: x方向的缩放系数 zoom_x和zoom_y一般取相同值,值越大,图像分辨率原创 2022-04-20 00:17:54 · 330 阅读 · 0 评论 -
python实现图片根据日期进行文件分类
from pathlib import Pathimport osimport shutilimport time# test为原始目录,work为分类照片存放目录dir1 = r'D:\upty\test'dir2 = r'D:\upty\work'# 包装,创建实例对象path1 = Path(dir1)path2 = Path(dir2)# 判断work目录(若不存在,则创建)if not path2.exists(): # 创建work目录 path2.m原创 2022-04-14 20:09:52 · 502 阅读 · 0 评论 -
Python合并csv文件 —— 本地文件整理
整理文件涉及需求的比较多,这里分享的是将本地多个 CSV 文件整合成一个文原创 2022-04-11 22:47:18 · 734 阅读 · 0 评论 -
Python批量将csv文件的编码方式转换为UTF-8
当我们用pandas是操作CSV文件的时候,常常会因为编码问题出现报错。下面我们用Python编写一个程序,用来批量转换csv文件的编码方式。原创 2022-04-11 22:35:09 · 15376 阅读 · 7 评论 -
python自动整理文件,就这么简单
平时工作没有养成分类的习惯,整个桌面杂乱无章都是文档和资料,几乎快占满整个屏幕了。所以必须要整理一下了,今天我们来看下用python如何批量将不同后缀的文件移动到同一文件夹。演示效果:使用前使用后代码:# # -*- coding:utf-8 -*-import osimport globimport shutilimport tkinterimport tkinter.filedialogfrom datetime import datetimedef start(原创 2022-04-08 21:41:30 · 2383 阅读 · 4 评论 -
python 实现批量md转word(针对在子文件夹中的md文档)
最近想要实现批量将mardown文档转化为word。网上有很多解决的方法,但是自己保存的md文档在不同的文件夹,而大部分只能实现同一文件夹内的转换,因此稍加改进,得出以下功能。from glob import globfrom pathlib import Pathimport osdirs = [ d for d in glob("./**/")]# 用在本文件夹内则调整为下列代码# dirs = [ d for d in glob("./")]# 提取所有的md文档路径al1原创 2022-03-11 22:06:21 · 1405 阅读 · 0 评论 -
Pynput基础使用
Pynput基础使用仅供自用查询,有疑问评论区留言。pynput安装pip install pynput鼠标控制from pynput.mouse import Controller,Buttonpynput库中的mouse模块是鼠标控制模块创建鼠标控制对象mouse = Controller()获取或设置鼠标位置mouse.Controller中为我们提供了方法来获取和设置鼠标位置信息# 获取鼠标位置import pynputfrom pynput.mouse原创 2022-03-07 22:14:28 · 9533 阅读 · 5 评论 -
用python将指定目录下的doc文件转换为docx格式
python提供了win32com模块,其中的SaveAs方法可以代替人手批量将文件另存为我们需要的格式。win32com包含在pypiwin32模块中,只需安装pypiwin32模块即可,按win+R出现命令提示符窗口。输入以下:pip install pypiwin32pip install pathlib下面的代码将指定目录下的doc文件转换为docx格式,并放在该目录的temp_dir下面:from win32com import client as wc # 导入模块from p原创 2021-01-16 19:19:32 · 1141 阅读 · 1 评论 -
利用python实现文件根据创建日期分类
思路:包装path对象,创建目录循环遍历所有文件,获取每一文件的属性,并创建日期目录移动文件from pathlib import Pathimport osimport shutilimport time# test为原始目录,work为分类照片存放目录dir1 = r'D:\upty\test'dir2 = r'D:\upty\work'# 包装,创建实例对象path1 = Path(dir1)path2 = Path(dir2)# 判断work目录(若不存在,则创原创 2022-01-07 21:34:49 · 1185 阅读 · 0 评论 -
Python自动化办公PPT-写入内容
1、安装模块2、from pptx import Presentationfrom pptx.util import Inches,Pt,Cmppt = Presentation()# 插入幻灯片,布局slide_layout为母版的第二个版式slide = ppt.slides.add_slide(ppt.slide_layouts[1])# 向占位符中添加文本,前提是占位符必须存在。body_shape = slide.shapes.placeholdersbody_shape[0原创 2020-09-09 16:00:59 · 726 阅读 · 0 评论 -
如何用python将pdf转换为txt、docx、excel(前提:能复制文字的pdf)
最近遇到了不小的麻烦。每每可以复制文字,我曾经我们在smallpdf、迅捷pdf上可以轻松地将pdf转换为word,可逐渐地这项功能变得不再好用。尤其是当pdf文件大于3M以上时,他就要求你开通会员,最近发现了一种方法,利用python的pdfplumber库可以实现转换,代码如下:一些常用的方法.extract_text() 用来提页面中的文本,将页面的所有字符对象整理为的那个字符串.extract_words() 返回的是所有的单词及其相关信息.extract_tables() 提取页面的表格原创 2020-12-31 20:30:44 · 2826 阅读 · 4 评论 -
Python自动化办公 - 对Word的操作(Python-docx的基本使用)
1 安装模块Windows用户打开命令行输入:pip install python-docxMac用户打开终端/Terminal输入:pip3 install python-docx导入模块:import docx如果无法安装,可以转换为国内清华镜像源,Windows系统操作如下:在cmd模式下输入pip install -i https://pypi.tuna.tsinghua.edu.cn/simple python-docx2 读取Word文档内容2.1 文档结构注意:一个ru原创 2020-09-01 22:07:05 · 9198 阅读 · 2 评论 -
Python自动化办公 - 对PPT的操作(Python-pptx的基本使用)
1.3.3 插入公式插入一列字体格式原创 2020-08-25 22:56:34 · 20801 阅读 · 13 评论 -
Python自动化办公 - 对Excel表格的操作(openpyxl的基本使用)
添加链接描述原创 2020-08-19 22:15:28 · 3606 阅读 · 2 评论 -
Python自动化办公-实现数据透视汇总
参考网站:python pandas中的agg函数微信公众号: python小工具 作者:yczx404标题1.数据汇总Excel中使用分类汇总和数据透视可以按特定维度对数据进行汇总,Python中使用的主要函数是groupby和pivot_table。import numpy as npimport pandas as pdimport pandas as pddf = pd.DataFrame({'A':['bob','millor','bob','bob'],原创 2020-08-04 20:38:01 · 1550 阅读 · 0 评论 -
Python自动化办公-使用 Python 将数据写入 CSV 文件(解决汉字乱码问题)
Python自动化办公-使用 Python 将汉字写入 CSV 文件先说下编码相关的知识。编码方式有很多种:ASCII, GBK UTF-8等。ASCII 码是美国在上个世纪 60 年代制定的一套字符编码。主要是规范英语字符和二进制位之间的关系。英语词汇组成简单,由 26 个字母构成。使用一个字节就能表示一个字母符号。外加各种符号,使用 128 个字符就满足编码要求。根据不完全统计,汉字的数量大约将近 10 万个,日常所使用的汉字有 3000 个。显然,ASCII 编码无法满足需求。所以汉字采用 GB原创 2020-08-09 13:33:10 · 277 阅读 · 0 评论