- 博客(44)
- 资源 (10)
- 问答 (1)
- 收藏
- 关注
原创 记录一个Python鼠标自动模块用法和selenium加载网页插件的设置
网页自动化代码编写过程中,有些网页元素是很难识别,或者因为反爬的机制,元素被隐藏或者加密,常规的办法无法实现自动点击,或者自动提交等操作,于是偶尔配合鼠标自动化的点击,或者网页插件配合,也可以紧急救场
2023-12-24 23:06:06 1153
原创 python 批量从PDF中提取表格(使用yield语法迭代数据)
【代码】python 批量从PDF中提取表格(使用yield语法迭代数据)
2023-03-04 16:37:56 419 1
原创 为了假期作业,用Python给一年级学生随机生成两个或者三个数加减法题目
为了假期作业,用Python给一年级学生随机生成两个或者三个数加减法题目
2023-01-23 23:26:33 1384
原创 利用开源古诗词数据集做诗词查询器,给孩子语文作业做辅助
把古诗词数据集的结构了解了大概,写了一个简单的诗歌查询功能,试了一下,还是比较方便,尤其现在我家小孩老师要求每天背古诗,所以给孩子查询古诗词的时候可以用用。文件结构如下,这里只做了唐诗,宋词,曹操诗歌,的基本查询,其他诗歌文件其实做法基本一样,把函数重复利用一下就可以了,大同小异,只是数据结构可能稍微不同,读取和查询条件需要修改一下。效果如下,扫描到查找的诗人或者诗句,就会输出诗句,同时显示文件位置。
2023-01-23 22:06:56 707
原创 python 使用turtle画平抛运动轨迹
寒假比较清闲,学了一下turtle的简单使用尝试做了一个平抛运动的模拟,顺便画了一个圆形。目前感觉是用线连续成的图,下一步想做成点图,目前没找到方法,请大神指点import turtleimport timeimport numpy as npturtle.title('搬码工琪老师')turtle.speed(1) # 速度# 平抛turtle.penup()turtle.goto(-200, 300)turtle.pencolor("black")turtle.pensize
2022-02-14 00:42:42 1277 1
原创 提取PDF每一页,所有表格,并按页码命名保存
本文代码有效提取标准格式的PDF表格,比如,一页有三个五个这种样式。提取后文件按照页码和表格编号顺序命名保存,(扫描版PDF无法提取)import pdfplumberimport pandas as pdimport openpyxlwith pdfplumber.open("4-51(工程).pdf") as pdf: #first_page = pdf.pages for i in range(len(pdf.pages)): #for i in rang
2021-10-19 18:57:43 675
原创 Python 利用win32com批量给excel加密
本文实现了批量给excel加密的办法 ,参考的网上的部分代码。运行时候第一个对话框是原始文件所在的位置选择,第二次对话框选择输出文件的位置,同时对加密函数添加一句代码,解决了批量运行报错的问题,pwd_xlsx里面加了wb.Close()这一句,有效解决问题。本文第二个特点,引用了之前见过一位大侠,用汉语写的一个获取文件路径的函数。import os, sysimport win32com.clientimport timeimport hashlibimport tkinter as tk
2021-07-24 20:43:14 1432 2
原创 用Python把PDF转为Word方法总结
先讲一下为啥要写这个文章,网上其实很多这种PDF转化的代码和软件。我一直想用Python做,但是网上搜到的代码很多都不能用,很多是2.7版本的代码,再就是PDF需要用到的库在导入的时候,很多的报错,解决起来特别费劲,而且自从2021年初以来,似乎网上很少有关PDF转化的代码出现了。我在研究了很多代码和pdfminer的用法后,改出来一个代码,目前仅支持标准格式的PDF,用来学习一下,后面我也有提取PDF表格的代码,放上。提取图片的还没有做,后续跟进。1 把标准格式的PDF转为Word适用于Python3.
2021-04-24 18:31:18 8543 4
原创 python傅里叶变换,模拟光孤子脉冲传输
读研究生的时候,孤子的数值模拟都是MATLAB完成的,说实话我根本不会MATLAB,都是导师教我基本的程序思路,固定模式编写,然后调参数,出数据。现在自己学会了Python,一直想做Python版本的代码出来。参考了不少人的博客,傅里叶变换更是似懂非懂,模模糊糊。代码是参考别人的博客,改出来的。改了一年多,今天忽然出来一个图片,我猜应该是思路对了,懂的朋友,给我指点一下,看看哪里还有问题。参考 文章:https://blog.csdn.net/ChouMaRenShen/article/details/9
2021-04-13 17:24:25 843
原创 Python+selenium批量把网页文档保存为PDF
网上有很多网页版的,免费的Python教程电子书,特别想保存下来,写爬虫的话,文字可以取出来,但是漂亮的版面就丢了啊,要是想保留排版样式,那代码量可就太大了,再说我也不会写啊。想了一下,发现可以直接利用Chrome浏览器的自带功能,批量把网页打印成PDF,岂不是很方便,这样只需要利用selenium就可以啦。网上找了找,果然有大佬写出了教程。参考教程地址:https://www.cnblogs.com/new-june/p/14509601.html爬取网页结构如图,代码如下import reque
2021-04-09 19:18:37 1880
原创 selenium加requests(携带cookies)自动化安全教育平台管理
先看效果。代码我已经详细做了注释。代码放在最后。上面是selenium获取的cookies.下面是自动查询未完成的学生名单。下面是显示,post方法查看请求头和cookies,cookies我是手动复制后放到代码里面,尤其第二页要用post的方式请求#此代码需要班主任的安全教育平台密码账户登录才可以运行#没有账户的朋友。可以学习一下思路from selenium import webdriverimport timefrom selenium.webdriver.chrome.servi
2021-04-03 12:34:50 426 1
原创 我的第一个Scrapy爬虫,入门级原理详解,附详细源码
平时写了很多小爬虫,最近找到一个小网页,页面特别简单,文章地址如下:(闲来无事,写个小爬虫,爬取1800篇高中作文)可以先了解一下爬取原理https://blog.csdn.net/hq606/article/details/115215425,可以实现几十页的批量爬取。具体文章我已经写到博客里面了,里面有详细的思路和代码。写完以后,我突发奇想,既然这个爬虫这么简单好实现,这么多页面,为啥不用scrapy试试呢?以前想学scrapy但是实在不懂人家的方法,但是凭着直觉,我感觉我的爬虫肯定可以比较简单的放
2021-03-29 18:47:37 189 2
原创 写个小爬虫,爬取1800篇高考优秀作文
主要目的练习爬虫BeautifulSoup requests 基本用法。同时一些小网页的文字总是注册后才让复制,好麻烦,所以干脆爬取试试。import requestsfrom bs4 import BeautifulSoup#url = 'http://www.ruiwen.com/pingyu/1293492.html' # 需要请求的网页的链接#url ='http://www.zuowen.com/yanjianggao/gqx/index_'+'5'+'.shtml' # 需要请求
2021-03-25 18:29:04 440 2
原创 班主任爬取学生评语,批量自动写入表格,应对大量重复填表任务
一个小网页,不让复制,所以写几句代码,爬取网页的文字,一般文字放在在P标签的那种网页,其实都可以用的把输出的文字复制粘贴保存到文件,命名为 评语.txtimport requestsfrom bs4 import BeautifulSoup# 第二步,请求网页内容url = 'http://www.ruiwen.com/pingyu/1293492.html' # 需要请求的网页的链接html = requests.get(url) # get方式请求数据# print(html.st
2021-03-23 21:53:18 408
原创 (pandas进阶) 两个表格对比,通过身份证和姓名,把新表的个人数据在旧表中进行标记
最近学习数据处理进阶。对pandas特别喜欢。所以一边学一边找小项目做。刚好姐姐单位有表格要处理。要求是把新调查的已经参加身体筛查的人名,在原始表格里面标记。但是原始表格好几千人,而新调查的表格几百人,表格只有名字和身份证是相关的,其他数据格式都不同。但是要从几千人里面,找到几百人,而且要在原始的表格数据标记出来,这样人工对比,筛选标记。肯定是很慢的,而且容易出错误。于是我用pandas实现了数据的快速筛选和标记。第一个功能:把条件表格和原始表格比对,找到原始表格已经参加体检的人,然后直接输出到新的表格另
2021-03-16 17:06:45 2003 1
转载 转载:python3简单的http.server互传文件的代码,可上传文件(改3处Bug)
经过修改Python3.6.5 和 3.8都可以执行 **修改的bug** 适用于Python3.6.51. import cgi下面 再加入 import html2. 257句 cgi.escape 改成 html.escape3. GetWanIp 类函数修改 注释掉以下几句 直接 return match_ip ip_dict = match_ip_dict
2021-03-05 22:36:14 458
原创 pandas快速把txt转为excel
单位的服务器导出来一个TXT工作数据文件,里面全部是用一堆空格分隔的,整个只有一列,每一行都特别长,想保存为Excel,踩了很多坑。先把代码放出来。import osimport numpy as npimport pandas as pdimport openpyxlwith open(r'C:\Users\Administrator\Desktop\0011.txt','r',encoding='UTF-8') as txt: content = txt.readlines()
2021-02-28 22:12:19 1634 1
原创 Python 办理信用卡业务---替老婆做把万人的名字转为拼音
老婆在银行上班,一天天的办理信用卡,但是大家知道信用卡的最底下,要打印上客户的拼音的为了这些个业务天天忙到深夜,我看了一下,这么枯燥重复的工作,难道不能用程序搞定吗?刚学Python一年的我直接上网一顿搜,然后胡乱修改,还真搞定了直接上代码from pypinyin import lazy_pinyinimport pandas as pd #读入EXCEL文件df = pd.read_excel("Book1.xlsx") #读取名字所在的表格result = ""for i i
2021-02-19 00:58:55 156
原创 python 读取MATLAB 产生的dat格式数据 绘制暗孤子传输3D图
读硕士期间写过一些光孤子传输的论文。当时随便数值模拟的一些数据,都是MATLAB完成的,现在也忘光了,网上倒是有不少MATLAB的仿真程序模拟光孤子的传输。直到现在,光孤子数值模拟的python程序我还是没有做出来。过年在家实在没事情,刷到我的母校的光电所的文章,号召大家向院士学习,对于已经毕业十年的我,蠢蠢欲动,特别怀念当时的读书生活。于是想到把当时的数据再拿出来研究一下。以前绘图用的是MATLAB数据加上origin,一直想用python读取dat数据进行画图,一直不成功今天终于成功了,科研需要的同
2021-02-18 19:14:07 896
原创 Tpyboard开发板DIY智能温控小风扇 改款
这里写自定义目录标题Tpyboard开发板DIY智能温控小风扇 改款下面是原文地址https://blog.csdn.net/weixin_34245749/article/details/92583136Tpyboard开发板DIY智能温控小风扇 改款你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。下面是原文地址https://blog.csdn.net/weixin_34
2020-12-05 22:04:32 340
原创 pandas提取单个人所有月考成绩放入一个表格
同事然我写一个代码 分析一个人高中三年的所有成绩 ,然后进行绘图测算,分析三年的成长过程,预测将来高考分数。下面直接上代码。先说明一下代码用法 运行成绩分析.py 会自动读取新建文件夹里面的所有成绩。然后输入名字 比如 我输入 张20 就会把他三次的成绩全部放到一起结果输出到output02.xlsx 里面然后就可以进行绘图,测算等等工作。我们这里先完成成绩的抽取工作,代码如下import pandas as pdimport numpy as npimport osfro
2020-11-23 19:49:33 662
原创 pyboard 实验遥控LED灯
想学习pyboard的遥控用法,做一个简单的遥控灯,以后可以继续加强实现遥控的各种功能。官方的文档:http://docs.tpyboard.com/zh/latest/tpyboard/driver/vs1838/# main.py -- put your code here!from necir import NecIrfrom bm import necbmfrom bm import nec_cbimport pybdef main(): nec = NecIr()
2020-09-28 22:24:54 341
原创 python硬件开发 pyboard做一个呼吸灯
import pybimport time# sw=pyb.Switch()led = pyb.LED(1)led3 = pyb.LED(3)led4 = pyb.LED(4)# led3.intensity([255])# led3.on()def hx(value): while value < 255: #led3.intensity(value) led4.intensity(value) # time.sleep(0.
2020-09-19 18:18:02 1240 2
原创 批量把含有同名的Excel合并
如图很多Excel 里面很多是一种或者一类的,含有同名的成分。所有干脆都把属于一类的合并。代码如下```python#! /usr/bin/python# -*- coding: UTF-8 -*- import os;import timeimport shutil;import difflib;import tkinter as tk #调用GUI图形模块from tkinter import filedialog #fileDir=os.getcwd();root =.
2020-09-03 11:32:29 1033
原创 csv批量转换为excel
# -*- coding:utf-8 –*- '''程序用来将csv批量转换为excel文件。指定源路径和目标路径。在main函数中指定源文件路径source,目标文件路径ob.''' # 导入pandasimport pandas as pdimport osimport time #调用时间模块import tkinter as tk #调用GUI图形模块from tkinter import filedialogimport csvimport xlwt#
2020-07-26 22:46:55 1955
原创 PDF 全部转为图片再用百度AI接口识别表格
本文实现用Python的方法 把PDF 全部转为图片再用百度AI接口识别表格最近工作 实在没有时间做代码,朋友又给了一个项目,提取PDF的表格。之前写过一个可以批量提取标准格式的表格数据,今天遇到一个PDF 用之前的方法怎么也不行,最后想了一个绝招,干脆把PDF全部转为图片,然后调用百度接口识别表格,发现可行,代码量少。最python的方法。第一步:把PDF转为图片import pdfplumberimport pandas as pd path = r'C:\Users\mayn\Desk
2020-07-07 00:02:21 1658
原创 学校快开学啦 我用pandas筛查体温统计表
之前写过一个批量提取excel数据的代码。今天把它改造成一个筛查几百人的体温数据代码,从里面提取体温超过37.3 的人的信息。直接上代码 注意: 所有xlsx格式的文件可以适用import pandas as pdimport numpy as npimport tkinter as tk #调用GUI图形模块from tkinter import filedialogfrom openpyxl import load_workbook,Workbookimport 获取excel文件名
2020-05-10 01:20:01 243
原创 第一次用Python 合成 ppt
源代码链接 http://www.voidcn.com/article/p-nzgvuozl-bqt.html我最近讲课需要经常制作ppt.但是素材很难找。目前可以在某个资源站搜索并下载可用的ppt,但是下载好以后全部是图片,想一次性导入到ppt里面,但是手动粘贴非常慢,而且每一次都要修改图片大小才能匹配ppt的页面。搜索了好久今天终于让我找到了。下面就介绍一下这次批量插入图片的方法。先上代...
2020-05-06 17:34:10 1496 1
原创 突然玩了一下translate翻译库,笑死我了,改天找网络流行语言,挨个翻译试试
直接上图上代码第一句是他给我翻译的英语。就我这英文基础,一看就味道不对啊,又让程序翻译成汉语。笑死我啦。今天先记到博客里面,有空把各种网络流行语言放进去试试。整理一个搞笑集出来。哈哈O(∩_∩)O哈哈~...
2020-04-23 00:27:28 1053
原创 让pandas狠狠的玩转excel
先来无事,开始总结自己最近学过做过的东西。想想,数据才是所有网络和编程的核心,包括人工智能。但是自己的数据处理能力,仅仅停留在excel基础,只用代码完成过64个表格的批量筛选和提取。后来阅读和搜索发现,Python里面处理数据,pandas和numpy才是王道。所以最近开始想办法学习这两个东西。怎么学?看代码,看书,太枯燥。买课又不想花钱。经过研究发现,pandas是可以处理类似excel结...
2020-04-21 18:43:04 393
原创 重复一遍别人的项目,手势识别
原文博客地址:https://blog.csdn.net/qq_45874897/article/details/105516981因为是别人的原创,实现过程和代码,请查阅上面原创者的博客,代码不是很复杂。我就把我的效果展示一下。顺便把一个重要的采坑说一下。以免大家出现这种报错。容易报错就地方就是cap = cv2.VideoCapture(r"C:\Users\mayn\Desktop\...
2020-04-17 12:12:42 220
原创 七行代码,excel存入数据库sqlite3
七行代码把excel存入数据库sqlite3本人博客地址 :https://blog.csdn.net/hq606作者 :hq606创作不易转载请注明链接和出处前面写了一篇关于把excel存入sqlit的方法。文章地址附上:https://blog.csdn.net/hq606/article/details/105534832可以看得出,(全靠xlrd方法)参考了大量文章,自己还修改...
2020-04-15 23:11:32 724
原创 excel转Sqlite数据库(Python方法)
import sqlite3import xlrd原文链接:https://blog.csdn.net/jinmie0193/article/details/96130678 # @Author : amarao# @File : ExcelToDbUtils.py# @Date : 2019-07-16 10:36# @Desc : Excel 转sqlite工具...
2020-04-15 18:06:19 1999
原创 python+tkinter创作老黄历,窗口化显示:择吉,五行,财福喜神
为了学习python,训练数据处理的能力,突发奇想,自己做一个老黄历进行查询。做这个,好处是网上有大量的参考代码,可以参考学东西,主要用到1.excel表格存为字典(网上有很多代码我就不写了)2.字典的导入,合并,查询第一步 .excel表格存为字典(网上有很多代码我就不写了,黄历数据自己随机下载一个,做成字典,就能啦)第二步 .合并数据,做成字典,保存有个字典的保存合并的代码挺好...
2020-04-08 16:27:37 1818
原创 老黄历数据难找?自写代码爬取
网上看到很多日历,万年历数据基本开源。但是老黄历可是难找。很多要花钱才能下载,或者有免费接口,还得注册。干脆自己爬取数据,将来好用得着。直接上代码。import requestsimport jsonimport timeimport pandas as pdimport refrom bs4 import BeautifulSoupfrom collections import...
2020-04-06 01:26:35 1155
原创 20行代码,爬取各地历史天气数据
最近有做工程的朋友,让写一个爬虫获取某城市的历史天气数据。要求不高,主要是希望能代替人工搜索数据,代码总是比较方便。而我作为一个初学者正在练习爬虫的学习。所以代码并不是很漂亮,但是思路还是比较清晰规范的。顺便练习了正则对数据的提取,字符串的切片,pandas的dataframe基本使用。先看爬取的网页http://tianqi.2345.com/wea_history/57516.htm这个...
2020-04-02 19:09:57 7773 24
转载 python开发_sqlite3_绝对完整(转载)
'''SQLite数据库是一款非常小巧的嵌入式开源数据库软件,也就是说没有独立的维护进程,所有的维护都来自于程序本身。在python中,使用sqlite3创建数据库的连接,当我们指定的数据库文件不存在的时候连接对象会自动创建数据库文件;如果数据库文件已经存在,则连接对象不会再创建数据库文件,而是直接打开该数据库文件。 连接对象可以是硬盘上面的数据库文件,也可以是建立在内存中的,在内...
2020-03-30 10:07:30 681
爬取作文 scrapy--zuowen.zip
2021-03-29
个人成绩批量提取代码和数据源
2020-11-23
1900-2099黄历all.npy
2020-04-08
1900-2099黄历.zip(2000-2019节日的列名有不同叫:节日1,其他都是:节日)修改可用
2020-04-07
耦合复变系数Ginzburg—Landau方程的啁啾类孤波研究.pdf
2020-03-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人