Python自动化
文章平均质量分 90
liying_tt
这个作者很懒,什么都没留下…
展开
-
Day5-Python自动化办公-爬虫入门与综合应用(DataWhale)
爬虫入门与综合应用1. requests简介pip install requestsre.status_code:响应的HTTP状态码re.text:响应内容的字符串形式re.content:响应内容的二进制形式re.encoding:响应内容的编码,常用的编码方式:ASCII、GBK、UTF-8、UTF-8-SIGre.headers:网址的headers所有信息re.cookies:cookies信息,cookie可以用于模拟登录,做会话维持re.urlre.history:请求的原创 2021-06-25 11:10:36 · 346 阅读 · 1 评论 -
Day4-Python自动化办公-Python与PDF(DataWhale)
Python操作PDF初级操作批量拆分批量合并提取文字内容提取表格内容提取图片内容转换为PDF图片添加水印加密和机密1. 相关介绍PyPDF2库更好地读取、写入、分割、合并PDF。主要是处理PDF文件pdfplumber库更好的读取PDF文件中的内容和PDF文件中的表格主要是处理PDF文件中的内容PyMuPDF库提取图片按装PyMuPDF库,但是import fitzpdf2image库将PDF转换为图片1.1 P原创 2021-06-23 00:17:25 · 253 阅读 · 1 评论 -
Day3-Python自动化办公-Python与Word(DataWhale)
Python自动化之word操作安装库pip3 install python-docx基础知识word文档的页面结构Document:文档Paragraph:段落Run:文字块python-docx将整个文章看作一个Document对象,基本结构为每个Document包含许多个代表“段落”的Paragraph对象,存放在document.paragraphs中每个Paragraph都有许多个代表"行内元素"的Run对象,存放在paragraph.runs中run是原创 2021-06-20 19:31:07 · 397 阅读 · 8 评论 -
Day2-Python自动化办公-Python与Excel(DataWhale)
Python自动化之Excel问题解决:使用jupyter lab导入openpyxl模块提示模块不存在,但是在库列表中查询是存在的,解决方案:直接在notebook中输入pip install openpyxl之后再import openpyxl即可概念:row:行,数字表示column:列,字母表示cell:单元格sheet:表1. Excel读取1.1 读取表格openpyxl库:load_workbook() 打开Excelsheet.dimensions 内容所在的单元原创 2021-06-18 19:12:38 · 213 阅读 · 0 评论 -
Day1-Python自动化办公-文件自动化处理(DataWhale)
1. 文件自动化处理1.1 读写文件1.1.1 文件与文件路径路径指明文件在计算机上的位置文件名指该位置的文件的名称os.path.join()函数创建文件名称字符串import osos.path.join('Datawhale', 'docu')> 'Datawhale\\docu' #其中一个斜杠是转义1.1.2 当前工作目录os.getcwd() 获取当前工作路径os.chdir() 改变当前工作目录1.1.3 路径操作绝对路径总是从根文件夹开始原创 2021-06-16 22:13:06 · 634 阅读 · 3 评论