python制作生活小工具
搬码工琪老师
一个热衷于python编程的物理教师。
展开
-
记录一个Python鼠标自动模块用法和selenium加载网页插件的设置
网页自动化代码编写过程中,有些网页元素是很难识别,或者因为反爬的机制,元素被隐藏或者加密,常规的办法无法实现自动点击,或者自动提交等操作,于是偶尔配合鼠标自动化的点击,或者网页插件配合,也可以紧急救场原创 2023-12-24 23:06:06 · 1184 阅读 · 0 评论 -
python 批量从PDF中提取表格(使用yield语法迭代数据)
【代码】python 批量从PDF中提取表格(使用yield语法迭代数据)原创 2023-03-04 16:37:56 · 458 阅读 · 1 评论 -
为了假期作业,用Python给一年级学生随机生成两个或者三个数加减法题目
为了假期作业,用Python给一年级学生随机生成两个或者三个数加减法题目原创 2023-01-23 23:26:33 · 1445 阅读 · 0 评论 -
利用开源古诗词数据集做诗词查询器,给孩子语文作业做辅助
把古诗词数据集的结构了解了大概,写了一个简单的诗歌查询功能,试了一下,还是比较方便,尤其现在我家小孩老师要求每天背古诗,所以给孩子查询古诗词的时候可以用用。文件结构如下,这里只做了唐诗,宋词,曹操诗歌,的基本查询,其他诗歌文件其实做法基本一样,把函数重复利用一下就可以了,大同小异,只是数据结构可能稍微不同,读取和查询条件需要修改一下。效果如下,扫描到查找的诗人或者诗句,就会输出诗句,同时显示文件位置。原创 2023-01-23 22:06:56 · 761 阅读 · 0 评论 -
用Python 做成语接龙,超简单,有语音,过年和孩子玩
用Python 做成语接龙,超简单,有语音,过年和孩子玩原创 2023-01-04 17:14:31 · 1614 阅读 · 0 评论 -
提取PDF每一页,所有表格,并按页码命名保存
本文代码有效提取标准格式的PDF表格,比如,一页有三个五个这种样式。提取后文件按照页码和表格编号顺序命名保存,(扫描版PDF无法提取)import pdfplumberimport pandas as pdimport openpyxlwith pdfplumber.open("4-51(工程).pdf") as pdf: #first_page = pdf.pages for i in range(len(pdf.pages)): #for i in rang原创 2021-10-19 18:57:43 · 706 阅读 · 0 评论 -
Python 利用win32com批量给excel加密
本文实现了批量给excel加密的办法 ,参考的网上的部分代码。运行时候第一个对话框是原始文件所在的位置选择,第二次对话框选择输出文件的位置,同时对加密函数添加一句代码,解决了批量运行报错的问题,pwd_xlsx里面加了wb.Close()这一句,有效解决问题。本文第二个特点,引用了之前见过一位大侠,用汉语写的一个获取文件路径的函数。import os, sysimport win32com.clientimport timeimport hashlibimport tkinter as tk原创 2021-07-24 20:43:14 · 1486 阅读 · 2 评论 -
用Python把PDF转为Word方法总结
先讲一下为啥要写这个文章,网上其实很多这种PDF转化的代码和软件。我一直想用Python做,但是网上搜到的代码很多都不能用,很多是2.7版本的代码,再就是PDF需要用到的库在导入的时候,很多的报错,解决起来特别费劲,而且自从2021年初以来,似乎网上很少有关PDF转化的代码出现了。我在研究了很多代码和pdfminer的用法后,改出来一个代码,目前仅支持标准格式的PDF,用来学习一下,后面我也有提取PDF表格的代码,放上。提取图片的还没有做,后续跟进。1 把标准格式的PDF转为Word适用于Python3.原创 2021-04-24 18:31:18 · 8724 阅读 · 4 评论 -
Python+selenium批量把网页文档保存为PDF
网上有很多网页版的,免费的Python教程电子书,特别想保存下来,写爬虫的话,文字可以取出来,但是漂亮的版面就丢了啊,要是想保留排版样式,那代码量可就太大了,再说我也不会写啊。想了一下,发现可以直接利用Chrome浏览器的自带功能,批量把网页打印成PDF,岂不是很方便,这样只需要利用selenium就可以啦。网上找了找,果然有大佬写出了教程。参考教程地址:https://www.cnblogs.com/new-june/p/14509601.html爬取网页结构如图,代码如下import reque原创 2021-04-09 19:18:37 · 1943 阅读 · 0 评论 -
selenium加requests(携带cookies)自动化安全教育平台管理
先看效果。代码我已经详细做了注释。代码放在最后。上面是selenium获取的cookies.下面是自动查询未完成的学生名单。下面是显示,post方法查看请求头和cookies,cookies我是手动复制后放到代码里面,尤其第二页要用post的方式请求#此代码需要班主任的安全教育平台密码账户登录才可以运行#没有账户的朋友。可以学习一下思路from selenium import webdriverimport timefrom selenium.webdriver.chrome.servi原创 2021-04-03 12:34:50 · 450 阅读 · 1 评论 -
写个小爬虫,爬取1800篇高考优秀作文
主要目的练习爬虫BeautifulSoup requests 基本用法。同时一些小网页的文字总是注册后才让复制,好麻烦,所以干脆爬取试试。import requestsfrom bs4 import BeautifulSoup#url = 'http://www.ruiwen.com/pingyu/1293492.html' # 需要请求的网页的链接#url ='http://www.zuowen.com/yanjianggao/gqx/index_'+'5'+'.shtml' # 需要请求原创 2021-03-25 18:29:04 · 487 阅读 · 2 评论 -
班主任爬取学生评语,批量自动写入表格,应对大量重复填表任务
一个小网页,不让复制,所以写几句代码,爬取网页的文字,一般文字放在在P标签的那种网页,其实都可以用的把输出的文字复制粘贴保存到文件,命名为 评语.txtimport requestsfrom bs4 import BeautifulSoup# 第二步,请求网页内容url = 'http://www.ruiwen.com/pingyu/1293492.html' # 需要请求的网页的链接html = requests.get(url) # get方式请求数据# print(html.st原创 2021-03-23 21:53:18 · 430 阅读 · 0 评论 -
(pandas进阶) 两个表格对比,通过身份证和姓名,把新表的个人数据在旧表中进行标记
最近学习数据处理进阶。对pandas特别喜欢。所以一边学一边找小项目做。刚好姐姐单位有表格要处理。要求是把新调查的已经参加身体筛查的人名,在原始表格里面标记。但是原始表格好几千人,而新调查的表格几百人,表格只有名字和身份证是相关的,其他数据格式都不同。但是要从几千人里面,找到几百人,而且要在原始的表格数据标记出来,这样人工对比,筛选标记。肯定是很慢的,而且容易出错误。于是我用pandas实现了数据的快速筛选和标记。第一个功能:把条件表格和原始表格比对,找到原始表格已经参加体检的人,然后直接输出到新的表格另原创 2021-03-16 17:06:45 · 2064 阅读 · 1 评论 -
转载:python3简单的http.server互传文件的代码,可上传文件(改3处Bug)
经过修改Python3.6.5 和 3.8都可以执行 **修改的bug** 适用于Python3.6.51. import cgi下面 再加入 import html2. 257句 cgi.escape 改成 html.escape3. GetWanIp 类函数修改 注释掉以下几句 直接 return match_ip ip_dict = match_ip_dict转载 2021-03-05 22:36:14 · 485 阅读 · 0 评论 -
Python 办理信用卡业务---替老婆做把万人的名字转为拼音
老婆在银行上班,一天天的办理信用卡,但是大家知道信用卡的最底下,要打印上客户的拼音的为了这些个业务天天忙到深夜,我看了一下,这么枯燥重复的工作,难道不能用程序搞定吗?刚学Python一年的我直接上网一顿搜,然后胡乱修改,还真搞定了直接上代码from pypinyin import lazy_pinyinimport pandas as pd #读入EXCEL文件df = pd.read_excel("Book1.xlsx") #读取名字所在的表格result = ""for i i原创 2021-02-19 00:58:55 · 170 阅读 · 0 评论