表格处理
搬码工琪老师
一个热衷于python编程的物理教师。
展开
-
python 批量从PDF中提取表格(使用yield语法迭代数据)
【代码】python 批量从PDF中提取表格(使用yield语法迭代数据)原创 2023-03-04 16:37:56 · 402 阅读 · 1 评论 -
分析2667所高校,历年,各专业录取数据分数,绘图显示
【代码】爬虫分析各高校历年专业录取分数数据。原创 2023-02-09 18:18:16 · 395 阅读 · 0 评论 -
Python 利用win32com批量给excel加密
本文实现了批量给excel加密的办法 ,参考的网上的部分代码。运行时候第一个对话框是原始文件所在的位置选择,第二次对话框选择输出文件的位置,同时对加密函数添加一句代码,解决了批量运行报错的问题,pwd_xlsx里面加了wb.Close()这一句,有效解决问题。本文第二个特点,引用了之前见过一位大侠,用汉语写的一个获取文件路径的函数。import os, sysimport win32com.clientimport timeimport hashlibimport tkinter as tk原创 2021-07-24 20:43:14 · 1398 阅读 · 2 评论 -
用Python把PDF转为Word方法总结
先讲一下为啥要写这个文章,网上其实很多这种PDF转化的代码和软件。我一直想用Python做,但是网上搜到的代码很多都不能用,很多是2.7版本的代码,再就是PDF需要用到的库在导入的时候,很多的报错,解决起来特别费劲,而且自从2021年初以来,似乎网上很少有关PDF转化的代码出现了。我在研究了很多代码和pdfminer的用法后,改出来一个代码,目前仅支持标准格式的PDF,用来学习一下,后面我也有提取PDF表格的代码,放上。提取图片的还没有做,后续跟进。1 把标准格式的PDF转为Word适用于Python3.原创 2021-04-24 18:31:18 · 8413 阅读 · 4 评论 -
班主任爬取学生评语,批量自动写入表格,应对大量重复填表任务
一个小网页,不让复制,所以写几句代码,爬取网页的文字,一般文字放在在P标签的那种网页,其实都可以用的把输出的文字复制粘贴保存到文件,命名为 评语.txtimport requestsfrom bs4 import BeautifulSoup# 第二步,请求网页内容url = 'http://www.ruiwen.com/pingyu/1293492.html' # 需要请求的网页的链接html = requests.get(url) # get方式请求数据# print(html.st原创 2021-03-23 21:53:18 · 400 阅读 · 0 评论 -
(pandas进阶) 两个表格对比,通过身份证和姓名,把新表的个人数据在旧表中进行标记
最近学习数据处理进阶。对pandas特别喜欢。所以一边学一边找小项目做。刚好姐姐单位有表格要处理。要求是把新调查的已经参加身体筛查的人名,在原始表格里面标记。但是原始表格好几千人,而新调查的表格几百人,表格只有名字和身份证是相关的,其他数据格式都不同。但是要从几千人里面,找到几百人,而且要在原始的表格数据标记出来,这样人工对比,筛选标记。肯定是很慢的,而且容易出错误。于是我用pandas实现了数据的快速筛选和标记。第一个功能:把条件表格和原始表格比对,找到原始表格已经参加体检的人,然后直接输出到新的表格另原创 2021-03-16 17:06:45 · 1980 阅读 · 1 评论 -
pandas快速把txt转为excel
单位的服务器导出来一个TXT工作数据文件,里面全部是用一堆空格分隔的,整个只有一列,每一行都特别长,想保存为Excel,踩了很多坑。先把代码放出来。import osimport numpy as npimport pandas as pdimport openpyxlwith open(r'C:\Users\Administrator\Desktop\0011.txt','r',encoding='UTF-8') as txt: content = txt.readlines()原创 2021-02-28 22:12:19 · 1618 阅读 · 1 评论 -
Python 办理信用卡业务---替老婆做把万人的名字转为拼音
老婆在银行上班,一天天的办理信用卡,但是大家知道信用卡的最底下,要打印上客户的拼音的为了这些个业务天天忙到深夜,我看了一下,这么枯燥重复的工作,难道不能用程序搞定吗?刚学Python一年的我直接上网一顿搜,然后胡乱修改,还真搞定了直接上代码from pypinyin import lazy_pinyinimport pandas as pd #读入EXCEL文件df = pd.read_excel("Book1.xlsx") #读取名字所在的表格result = ""for i i原创 2021-02-19 00:58:55 · 143 阅读 · 0 评论 -
pandas提取单个人所有月考成绩放入一个表格
同事然我写一个代码 分析一个人高中三年的所有成绩 ,然后进行绘图测算,分析三年的成长过程,预测将来高考分数。下面直接上代码。先说明一下代码用法 运行成绩分析.py 会自动读取新建文件夹里面的所有成绩。然后输入名字 比如 我输入 张20 就会把他三次的成绩全部放到一起结果输出到output02.xlsx 里面然后就可以进行绘图,测算等等工作。我们这里先完成成绩的抽取工作,代码如下import pandas as pdimport numpy as npimport osfro原创 2020-11-23 19:49:33 · 648 阅读 · 0 评论 -
批量把含有同名的Excel合并
如图很多Excel 里面很多是一种或者一类的,含有同名的成分。所有干脆都把属于一类的合并。代码如下```python#! /usr/bin/python# -*- coding: UTF-8 -*- import os;import timeimport shutil;import difflib;import tkinter as tk #调用GUI图形模块from tkinter import filedialog #fileDir=os.getcwd();root =.原创 2020-09-03 11:32:29 · 1015 阅读 · 0 评论 -
csv批量转换为excel
# -*- coding:utf-8 –*- '''程序用来将csv批量转换为excel文件。指定源路径和目标路径。在main函数中指定源文件路径source,目标文件路径ob.''' # 导入pandasimport pandas as pdimport osimport time #调用时间模块import tkinter as tk #调用GUI图形模块from tkinter import filedialogimport csvimport xlwt#原创 2020-07-26 22:46:55 · 1943 阅读 · 0 评论 -
PDF 全部转为图片再用百度AI接口识别表格
本文实现用Python的方法 把PDF 全部转为图片再用百度AI接口识别表格最近工作 实在没有时间做代码,朋友又给了一个项目,提取PDF的表格。之前写过一个可以批量提取标准格式的表格数据,今天遇到一个PDF 用之前的方法怎么也不行,最后想了一个绝招,干脆把PDF全部转为图片,然后调用百度接口识别表格,发现可行,代码量少。最python的方法。第一步:把PDF转为图片import pdfplumberimport pandas as pd path = r'C:\Users\mayn\Desk原创 2020-07-07 00:02:21 · 1641 阅读 · 0 评论 -
学校快开学啦 我用pandas筛查体温统计表
之前写过一个批量提取excel数据的代码。今天把它改造成一个筛查几百人的体温数据代码,从里面提取体温超过37.3 的人的信息。直接上代码 注意: 所有xlsx格式的文件可以适用import pandas as pdimport numpy as npimport tkinter as tk #调用GUI图形模块from tkinter import filedialogfrom openpyxl import load_workbook,Workbookimport 获取excel文件名原创 2020-05-10 01:20:01 · 238 阅读 · 0 评论 -
让pandas狠狠的玩转excel
先来无事,开始总结自己最近学过做过的东西。想想,数据才是所有网络和编程的核心,包括人工智能。但是自己的数据处理能力,仅仅停留在excel基础,只用代码完成过64个表格的批量筛选和提取。后来阅读和搜索发现,Python里面处理数据,pandas和numpy才是王道。所以最近开始想办法学习这两个东西。怎么学?看代码,看书,太枯燥。买课又不想花钱。经过研究发现,pandas是可以处理类似excel结...原创 2020-04-21 18:43:04 · 389 阅读 · 0 评论 -
openpyxl批量修改excel格式,遍历所有的sheet
今天帮朋友写一个代码批量修改表格的格式。发现openpyxl比较适合,而且网上有很多参考的脚本。这个是我自己独立完成的,当然也是积累了很多脚本以后,才有思路和方法。用了一下午完成的。话不多说了,直接上代码。**这里我把很多种格式都列出来了,而且,指定特定颜色区域进行修改。而且为了好玩,每次随机变换格式。**非黄色的额区域都被随机修改过了。其实,只有黄色区域那里没有被修改。下面是代码:impo...原创 2020-03-26 21:19:41 · 2570 阅读 · 0 评论