自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 资源 (18)
  • 收藏
  • 关注

原创 python docx寻找到文中图片下载并反相处理

寻找到图片有两种方法,见下面代码,inline_shapes是内联图片的遍历,找到rid,用document_par.related_parts[rID]获取图片。用图片._blob保存。from docx import Document #pip3 install python-docx from docx.shared import Inches #英寸import os #from docx import Documentfrom docx.shared import Ptfro

2020-05-31 18:54:34 423

原创 python docx加入表格 在表格中加图,设置框线

想在docx表格中插入图使表格框线设置为白色,即隐藏。以下代码为设置框线from docx.oxml import OxmlElementfrom docx.oxml.ns import qndef set_cell_border(cell, **kwargs): """ Set cell`s border Usage: set_cell_border( cell, top={"sz": 12, "val": "single",

2020-05-30 09:19:40 4190

原创 python 再复习一下遍历目录下文件及子文件夹

“./”:代表目前所在的目录。" . ./"代表上一层目录。“/”:代表根目录。注意点的位置就是了import osfor image in os.listdir(os.path.join(os.getcwd(),"利润表")): print(image)for root, dirs, files in os.walk("./", topdown=False): # "./利润表"ge print("所有文件: ") for name in files:

2020-05-24 19:05:27 447

原创 python open 判断图形进行分页截取

分析图像,在横向有一灰线,首先要判断位置,约在480-530间,只有白色和灰线,则取500为判断点位,另外在两页间,有广告,广告高度小于200广告与页面间也有灰线,判断小于200的,视为广告,不截取import osimport cv2 #pip install opencv-python# from matplotlib import pyplot as pltdef cut(start_y, end_y, width, number): save_path = "D:\\ima

2020-05-24 18:19:52 153

原创 pandas 出现:A value is trying to be set on a copy of a slice from a DataFrame的解决方法

想改变pandas dataframe中某数值的方法,用 dfc[‘A’][0] = 12 明显错误test.py:28: SettingWithCopyWarning:A value is trying to be set on a copy of a slice from a DataFrameSee the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.

2020-05-24 12:46:44 2641

原创 python pandas 两行或多行合并相加,并删除原有行

下面的方法只有方法一是正确的,方法二、三都无法正确处理,有知道怎么正确写法的请指教。import pandas as pdchengji = ([[100, 95, 100, 99], [90, 98, 99, 100], [88, 95, 98, 88], [99, 98, 97, 87], [96.5, 90, 96, 85], [94, 94, 93, 91], [91, 99, 92, 87], [85, 88, 85, 90], [90, 9

2020-05-23 23:33:24 6675

原创 pandas直取符合条件的某值

想取到名称为BB的class的值import pandas as pddf = pd.DataFrame([['AA',1,2,3],['BB',1,2,3],['CC',1,2,3],['DD',1,2,3]],columns=['name','age','class','type'])print(df)print(df['class'][df['name']=='BB'].values[0])print(df.loc[df['name']=='BB','class'].values[0])p

2020-05-23 14:33:24 1387

原创 python 几种用字典统计的写法

统计list中第一个元素的数量#统计list中的数量list1 = [['abc',6],['bcd',3],['bcd',2]]list2=list(set([x[0] for x in list1]))print([[0]*len(list2)])dict1=dict(zip(list2,[0]*len(list2)))for x in list1: dict1[x[0]]=dict1[x[0]]+x[1]print(dict1)dict2={}for x in list1

2020-05-20 19:33:55 779

原创 python 操作excel表格中图形到word

在excel 中 图形为chart **的形式存在,图像以picture **的形式存在,则只取shape名称为chart的导入到WORD,使用docx 模块写入WORDfrom PIL import ImageGrab, Imageimport docxfrom docx.shared import Inchesfrom docx import Documentimport timeimport win32com.client as win32myDocument = Document(

2020-05-19 23:04:48 1983

原创 python docx首行缩进两字符的设定方法

用python 处理docx文档时,想设置首行缩进2字符,有的帖子给出用0.74CM代替,但设置字体后,很显然不是两个字符,找了网上的帖子,都没有合适的办法,于是手动设置文档后,读取后知道了:这是先设置的 # 首行缩进0.74厘米,即2个字符 paragraph_format.first_line_indent = Cm(0.74) 应该是这样设置 paragraph_format.first_line_indent =406400怎么知道属性的呢,用下面的办法

2020-05-18 20:06:36 10451 5

原创 pandas 指定某两行或多行相加

指定pandas某两行的数据相加,如果是列相加,直接data[‘列1’]=data[‘列2’]+data[‘列3’]即可,但行相加,则没有直接可用方法,采用下面的sum()的方法可以实现两行或多行相加data.loc[heji[0]]=data.loc[data[‘p’].isin(heji[1])].sum()data.loc[heji[0],‘p’]=heji[0]import pandas as pdchengji = [['N', 95,0], ['N', 100,88], ['N', 8

2020-05-16 10:23:43 14521

原创 pandas dataframe对除数是零的处理

如下例data2[‘营业成本率’] = data2[‘营业成本本年累计’]/data2[‘营业收入本年累计’]*100但有营业收入本年累计为0的情况,则营业成本率为inf,即无穷大,而需要在表中体现为零,用如下方法填充: data2['营业成本率'] = data2['营业成本本年累计']/data2['营业收入本年累计']*100 data2['营业成本率'].replace([np.inf, -np.inf, "", np.nan], 0, inplace=True)

2020-05-15 23:10:24 6023 2

原创 python 批量转换docx只转换了一个出现pywintypes.com_error被调用的对象已与其客户端断开连接

如下,把txt文件或.doc文件转换为docx,结果只转换了一个pywintypes.com_error: (-2147417848, ‘被调用的对象已与其客户端断开连接。’, None, None)#转换doc为docxdef doc2docx(fn): word = client.Dispatch("Word.Application") # 打开word应用程序 #for file in files: doc = word.Documents.Open(fn) #打开wor

2020-05-15 19:38:39 2888

原创 python 关于generator 和lambda转为列表的解决

我想给newtitle加个wslist,怎么出来的是[<function . at 0x0000000015300790>,或者是generator object at 0x00000000152F5F20>titlename=(['new_date','u01','u02','u03','s01','s02','s03'])wslists=['pm25','pm10','so2']for wslist in wslists: newtitle=([lambda x=x:ws

2020-05-13 21:05:26 456

原创 python 爬虫之soup标签内值的取法

import requestsfrom bs4 import BeautifulSoupres = requests.get('http://books.toscrape.com/catalogue/category/books/travel_2/index.html')soup = BeautifulSoup(res.text, 'html.parser')article = soup.find_all('article', class_='product_pod')print(article

2020-05-13 18:18:18 755

原创 python爬虫练习之soup1

import reimport requestsfrom bs4 import BeautifulSoupimport bs4def getHTMLText(url, headers): try: r = requests.get(url, timeout=30, headers=headers) r.raise_for_status() r.encoding = r.apparent_encoding return r.t

2020-05-12 20:28:39 229

原创 python爬虫练习基础篇

import reimport requestsfrom bs4 import BeautifulSoupheaders={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}url='http://pccz.court.gov.cn/pcajxxw/pcws/wsxq?id=9EE627

2020-05-12 19:51:29 328

原创 python去除网页内容标签形式

import reimport requestsfrom bs4 import BeautifulSoupheaders={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}url='http://pccz.court.gov.cn/pcajxxw/pcws/wsxq?id=9EE627

2020-05-12 19:25:09 600

原创 python openpyxl 画框线及背景色

from openpyxl.chart.shapes import GraphicalProperties,LineProperties #去掉 chart.graphical_properties = GraphicalProperties(ln=LineProperties(noFill=False)) props1 = GraphicalProperties(solidFill="8BADD9") # Style the lines chart.series[...

2020-05-11 21:25:10 2432

原创 python pandas 写入dataframe和Series改列名

dataframe可以用下面的方法直接改列名test.columns = [‘c’,‘b’]test.rename(columns={‘a’:‘c’},inplace=True)而只有一列时,需要用下面的方法data0=data0[‘Close’]data0.rename(ticker,inplace=True)

2020-05-09 23:11:05 2977

原创 python替换字符中的某个字符

要求在字符串里找到不同的,并用?代替,总结:方法1较快s=['83BD 44FaFFFF','83BD 55FEFFFF','83BD 66FEFFFF']first=s[0]diff=[]for s1 in s: for num in range(len(s1)): if first[num]!=s1[num] and num not in diff: diff.append(num)#方法1result=[]for s1 in s:

2020-05-08 22:44:49 1105

原创 python list中按某值排序

incomelist=[['10932','zhs',15805,4100,2310,983,330,1000],['10933','zhs',15002,4200,2320,986,330,1000],['10934','zhs',15003,4300,2330,989,330,1000],]print(sorted(incomelist,key=lambda x:x[2]),rev...

2020-05-07 20:16:17 6147 2

婚姻法中关于财产制度的论析.txt

此文本为本博客中例子中,显示词云所用参考文本,所需积分设为零不涉及其他内容,望通过审核,显示词云文本

2020-03-29

pdf合成2.exe

多个PDF合成为一个PDF,可以整理成自然顺序,避免如11,111,22,223,99这样的错误排列方法,对于已经加密的PDF不适用,要解密后再合成。

2020-02-20

imgsTOpdf2.exe

可以读取目录中的所有图片,并合成一个PDf文件,能在合成中自动查看图片大小,输出为outpu.pdf文件

2020-02-20

文件段落整理2.exe

支持打开文本文件,进行段落整理,因网络下载或从别的文件中拷贝的文本不合适而进行处理的小工具。可以另存文本,整理过程中显示整理结果。

2020-02-03

从文本中查找手机电话号.zip

从一些乱七八糟的格式里找到手机号码并整理出来,可以先显示保存,再另存为单独文件,支持打开txt文件。此版本为zip版本,不支持exe版本的,可以下载本版

2020-02-03

从文本中查找手机电话号查找并保存

从一些乱七八糟的格式里找到手机号码并整理出来,可以先显示保存,再另存为单独文件,支持打开txt文件。

2020-02-03

获取类及函数名1.zip

在已经安装python的计算机上,提取pip install 安装的包名、内的模块名、函数名,及函数参数,可以参考此文件所生成的output.txt查看。注意:需要已经配置好python的系统环境。此为zip版本,因exe版本不支持的,可以下载此版本。

2020-02-03

获取类及函数名1.exe

在已经安装python的计算机上,提取pip install 安装的包名、内的模块名、函数名,及函数参数,可以参考此文件所生成的output.txt查看。注意:需要已经配置好python的系统环境。

2020-02-03

调整PDF2.zip

可以将调整PDF的扫描页顺序,把奇偶页对换,或单独抽取奇、偶页文件成为单独PDF文件,或先抽取奇偶页再生成一个单独文件,方便因扫描书籍而产生的错误顺序现象,此版为ZIP版,因exe版不能运行的,可以用此版本

2020-02-03

调整PDF2.exe

可以将调整PDF的扫描页顺序,把奇偶页对换,或单独抽取奇、偶页文件成为单独PDF文件,或先抽取奇偶页再生成一个单独文件,方便因扫描书籍而产生的错误顺序现象

2020-02-03

Chronometask倒计时软件.zip

Chronometask 是一款绿色小巧的桌面倒计时增强软件,在软件中可以通过设置时间来达到关机,定时,打开网页等等信息,非常方便。

2020-01-14

EXCEL函数手册解除限制.pdf

收集的日常excel所使用的函数,并分类整理,是手头使用excel的必备手册,内容丰富,文件简洁,使用方便

2020-01-14

ISO IEC IEEE 15288-2015 [高清版].pdf

INTERNATIONAL STANDARD ISO/IEC/ IEEE 15288-2015 Systems and software engineering一 System life cycle processes

2020-01-13

fiddlerscript.txt

fiddler v5.0.20194.41348 版本内置script 文件,适用于修改script错误的原始修复版本,以备不时之需

2020-01-13

GifCam.exe

将截取的画面变为GIF格式保存,可以调整GIF的帧数,截取窗口大小,还可以进行编辑处理,界面简洁,操作方便简单

2020-01-12

屏幕画笔工具V2.0版本

是直接可以运行的小工具,运行后在屏幕的右上角,可以设置笔的颜色、宽度、透明度,以及一些常用的符号,并提供放大镜、存图功能

2020-01-06

python.zip

出错的代码,通过修改,找到正确答案,希望大家不要犯同样的错误,这里是错误的源代码,可以测试并修改,做为练习用

2020-01-04

排座次1.5.xlsm

利用excel表,排考场座位,可以横向排列,蛇形排列,斜形排列,做到相邻座位的同学非同班,能有效做到因座位安排而导致的作弊隐患,开源代码,直接可用

2020-01-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除