自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 收藏
  • 关注

原创 python 7行代码实现按照指定列拆分成多个sheet author:star

python 实现按照指定列拆分成多个sheet功能Excel中指定列,按照相同字符/数据,拆分成多个sheet,且以该数据为文件名,已实现同类数据在同一个文件中。例子如图所示,该文件有上万行的数据,需要将C列,按照相同凭证编号的数据放到同一个文件中。代码# encoding:gbkimport pandas as pddef split_excel_numbername(path,colname,savepath): ''' path: 源文件路径;

2021-09-18 17:01:52 436

原创 Python 调用微信公众号接口(RPA项目-交互篇)

一、需求背景: 在RPA项目中经常会遇到场景的结果或异常情况需要提醒业务人员,然而目前我们用的比较多的是‘消息框’,‘邮件’等功能,以完成交互。 二、优缺点:‘消息框’ 1. 优势: 能够直观在桌面显示; 2. 缺陷: 需要业务人员盯着屏幕,无法达到完全的释放人力;‘邮件’ 1. 优势: 无需业务人员盯着屏幕; 2. 缺陷: 有些客户会觉得再给机器人申请一个邮箱账户很麻烦...

2020-05-07 10:03:43 1288

原创 利用Windows定时任务启动RPA流程(目前仅对isearch测试)

最近以及之前的很长时间里,总会听到询问关于单机版在没有购买控制平台的前提下,能否实现定时启动流程。相信该问题也困扰了一大部分人,客户购买后觉得不是自己想要的,销售这边也在苦恼,技术也在寻找解决方案。然而,很高兴的要向大家分享一下,这个问题我们可以解决了,下面我将分享一下我的思路。思路:思路一: 通过调用设计器环境中的Python程序去执行该流程中的main.py文件, 并将该命令写...

2020-04-02 11:52:26 1265

原创 Python 词云

一、定义又称 文字云。是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据。通常用于描述网站上的关键字元数据(标签),或可视化自由格式文本。 每个词的重要性以字体大小或颜色显示。由词汇组成类似云的彩色图形。“词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(RichGordon)于近日提出。戈登做过编辑、记者,曾担任迈阿密先驱报(MiamiHeral...

2019-12-06 10:16:23 857

原创 Python 写 Excel 列宽,行高的一些方法

使用第三方库 xlsxwriter,结果文件格式为xlsx。代码如下: import xlsxwriter# 创建一个新工作簿并添加一个工作表。workbook = xlsxwriter.Workbook(r'\\Mac\Home\Desktop\test11.xlsx')worksheet = workbook.add_worksheet('test')# 为第一列设置格式...

2019-12-06 10:15:28 14355

原创 换个思路做流程 python处理Excel

一、需求描述:1、需求为:将一个月的员工打卡记录,写进Excel,并在状态一列,添加员工是正常打卡,还是迟到与早退。2、判断状态规则:当日08:30前上班,17:30后下班为正常;3、源文件:为dat格式,用Notepad++ 打开如下图所示: 信息中有员工工号,打卡日期及时间4、最终输出格式:按照如下图所示,将打卡数据,通过工号匹配另一张员工信息表,得到员工姓名及所...

2019-12-06 10:13:35 196

原创 读取 CSV 文件可能遇到的问题

当然我们读,用到的库是pandas方法大致如下:import pandas as pddf=pd.read_csv('csv文件路径', sep=','encoding='gbk')可能遇到的问题如下:1、设计器中报错为:Initializing from file failed遇到以上报错提示,解决方法:f = open('csv文件')df = pd.read_csv(...

2019-12-06 10:12:47 2430

原创 某某航空 - 三方对账案例 (Python 处理Excel)

一、需求:支付宝账单: 1.支付数据筛选:①筛选L列业务类型为:交易付款 即为所有支付交易;②比对所需内容为B列的交易流水号以及H列的收 入金额,C列起始票号。淘宝账单:1.附件“国际预订成功”表中,比对所需内容为AL列的“银行订单号”以及V列的“总价”,相同的银行订单号,总价相加;2.附件“国内预订成功”表中,比对所需内容为Z列的“支付宝流水号”以及S列的“航段全价”,相同支付...

2019-12-06 10:11:55 1747

原创 Python xls 转 xlsx 格式

代码如下:import win32com.client as win32fname = r"\\Mac\Home\Desktop\isearch_list2.xls" # 文件路径excel = win32.gencache.EnsureDispatch('Excel.Application')wb = excel.Workbooks.Open(fname)wb.SaveAs(...

2019-12-06 10:10:50 1667 2

原创 Python CSV 格式转 xlsx 文件

代码如下:import csv# 将CSV文件转为xlsx格式f = open('%s/%s/source_file/%s农行.csv' % (r_path, t, t), encoding='gbk') # CSV文件路径,注意编码问题csv = pd.read_csv(f, header=2, delimiter=',', sep='\t', error_bad_li...

2019-12-06 10:10:09 2346

原创 python 调用企查查接口平台

一、需求:通过内部系统导出企业信息数据后,筛选状态为“正常”的企业数据。然后拿筛选后的企业去查询该企业的工商数据。开始是在国家企业信息公示系统中查询,由于查询数据量过大,后改用从企查查接口平台,通过接口获取企业信息。二、代码如下:import requestsimport timeimport hashlibimport json# 请求参数appkey = "xxxxxx...

2019-12-06 10:09:35 3082

原创 python 合并文件夹下 Excel 文件并去重(xlsx 与 CSV 格式)

xlsx 格式代码如下:import pandas as pd## 此处的Excel_dir 可以是组件,‘查找文件’的返回值excel_dir = ['//mac/Home/Desktop/考试信息数据归档/人员信息2.xlsx', '//mac/Home/Desktop/考试信息数据归档/人员信息.xlsx']li = []for i in excel_dir: li.a...

2019-12-06 10:08:43 1013

原创 如何使用 Python 对 Excel 做一份数据透视表

客户这边,其中有一张如同上图所示的数据汇总表,然而需求是,需要将这张表数据做一个数据透视表,最后通过数据透视表中的数据,填写至系统数据库。拿到需求,首先就想到肯定不能直接用设计器去操作Excel,通过操作Excel去做数据透视表,那样,就得通过代码去完成了。代码分享如下:import pandas as pdimport numpy as npdef prvot(): f = ...

2019-12-05 20:01:19 949

原创 python 如何将大的 Excel 无损拆分成若干个小文件

前段时间有个同事在项目中遇到一个问题,需求中有一个是将Excel文件传入系统,但是上传过程中,发现文件太大,无法上传。因而需要将该大文件拆分成若干个小文件,在上传。代码如下:# coding=utf-8import osimport pandas as pdimport mathdef file_split(filename, file_num, header=True): #...

2019-12-05 20:00:46 2735

原创 python 如何将同一文件夹下所有 pdf 文件合并,并按照规定将合成后的文件命名

# 使用os模块walk函数,搜索出某目录下的全部pdf文件###获取同一个文件夹下的所有PDF文件名###import osimport os.pathfrom PyPDF2 import PdfFileReader, PdfFileWriterimport timefrom os import listdirdef getFileName(filepath): file_l...

2019-12-05 19:59:50 990

原创 python 如何在数据量不同的 TXT 文本中拿到所需的数据

如图,需要拿到红色框中的三个数据,中间黄色框的数据量不定。刚拿到需求的时候,头痛,没思路,无从下手。无法通过切片去获得,因为不知道中间黄色区域的数据量有多少。后面想到一个比较方便的方法,代码如下 date = [] with open('C:/file/test/test1/201905/20190330.txt',encoding='gbk',errors='ignore') as ...

2019-12-05 19:59:04 175

原创 python 使用代码写 Word 表格

需求是从Excel中读取信息,写入下图所示的Word表格中难点:无法像写入Excel单元格一样,把数据填入Word表格中。思路:1、将Word表格模板放到Excel中,向Excel单元格填入数据,最终将Excel中数据加表格放到Word;2、直接代码,写Word表格,并将数据传入。这边用的是第二种方法,直接通过docx库向Word写入表格+数据代码如下: from docx ...

2019-12-05 19:58:11 4210 1

原创 使用 docx 库读取 Word 中表格数据

需求如下图:从下图Word表格中,读取填入的数据,并进行判断选项,最终将数据填入客户系统。代码处理如下: import docx from docx import Document #导入库 path = r"\\Mac\Home\Desktop\\asd.docx" #文件路径 document = Document(path) #读入文件 tables = docu...

2019-12-05 19:57:30 1984 1

原创 将 Excel 数据转 Word 表格

本帖解决的是将Excel里的数据,写入Word表格。涉及到的知识点:读Excel,并转化为列表形式;写Word表格注意点:读Excel中,遇到空值,读出来为 nan,这里需要改变一下,遇到值为 nan 的,需转化为 “ ”;excel 中部分数据如下图:实现结果,Word中部分呈现如下:代码如下:from docx import Document...

2019-12-05 19:56:39 345

原创 向 Excel 单元格中写入链接

如题,向Excel单元格中写入链接,包括:“网址”,“邮箱”,“本地文件路径”使用库:xlsxwriter代码如下: import xlsxwriter # 创建一个新工作簿并添加一个工作表。 workbook = xlsxwriter.Workbook(r'\\Mac\Home\Desktop\test33.xlsx') worksheet = workbook.add_w...

2019-12-05 19:56:06 384

原创 将 Word 表格中数据写入 Excel

如题,代码其实在之前的线上培训已经讲过。现分享该代码,并在基础上再次处理具体代码如下:from docx import Document # 读Word的库from openpyxl import Workbook # 写Excel的库“““file_path : Word文本的路径 save_path : ...

2019-12-05 19:55:07 668

原创 Word 表格填写信息(XX 证券案例)

一、需求:如上图所示,文件为docx格式,需要从Excel表格取出数据,填入上图对应的单元格内。二、分析:Excel取数据,这里我们可以轻松拿到。问题是,我们如何将取出的数据填入到Word表格中。因为Word里面的表格不同Excel,在Excel里面,我们可以任意填入对应的单元格。但是在Word里面,我们并不可以这样快捷的实现。三、实现方法:1、若Word中的表格并不复杂,且没有众多的...

2019-12-05 19:54:16 492

原创 使用 difflib 比对 Word

注意,此方法比对,不包括Word表格中数据方法一:代码如下:import docximport codecsfrom difflib import HtmlDifffile1 = docx.Document(r'\\Mac\Home\Desktop\project\天华\test1.docx')file2 = docx.Document(r'\\Mac\Home\Desktop...

2019-12-05 19:53:33 550

原创 关于处理 PPT 中表格数据的思路(未完)

一、需求:如图所示:(图片显示并非真实数据,已改成测试数据)需要每期将图片中的红色方框中的数据替换成当期的,当期的数据源来至于Excel。二、分析:手工处理的思路如下图:手动选中该数据所在的框,右击,进入‘编辑数据’,会进入下图界面再通过复制当期的数据,粘贴进上界面,保存关闭,便实现。三、RPA的思路(未完)使用RPA处理此类问题的时候,本人不太喜欢通过前段的方式,按照人手工...

2019-12-04 11:05:18 490

原创 python 生成数据透视表后写入 Excel

接 https://mp.csdn.net/mdeditor/103382996#。如上贴中,得到数据透视表后,我们如何写入Excel呢?如果我们将得到的返回值直接写入Excel,会发现,会出现丢失第一列(索引列)的数据。解决方案:方法1、将返回值转换成字符串,代码如下:# res 为上一篇帖子的返回值。a = str(res).split('\n')newlist = []for...

2019-12-04 11:04:25 5308 2

原创 如何使用 Python 对 Excel 做一份数据透视表(RPA实施-Excel篇)

客户这边,其中有一张如同上图所示的数据汇总表,然而需求是,需要将这张表数据做一个数据透视表,最后通过数据透视表中的数据,填写至系统数据库。拿到需求,首先就想到肯定不能直接用设计器去操作Excel,通过操作Excel去做数据透视表,那样,就得通过代码去完成了。代码分享如下:import pandas as pdimport numpy as npdef prvot(): f = ...

2019-12-04 11:03:24 947

原创 读取 Excel 的另外两种处理方法

将Excel数据读取出来后,组成字典形式:一、以第一行表头为键,以下内容为字典的值:如图数据,rpa处理方法如下:代码一代码为:list = []代码二代码为:dict = {}for b,value in enumerate(i): dict[df.values[0][b]] = i[b]list.append(dict)1、注意:如图所示:需将header默认...

2019-12-04 11:02:27 312

原创 一行代码筛选出 Excel 中前后两年账单差值比例超过指定范围的数据

一、需求:测试数据如下图:需筛选出第二年于第一年差值与第一年的比例超过50%的数据二、实现如下:注意注意1、 金额的数据类型如图所示,将两列金额数据以 int 类型读取出来注意2、绝对值两年的差值 前面需要 加上 abs,意将差值转换成正数。最终实现如下:是不是很迅速,很方便就得到了。...

2019-12-04 11:01:43 462

原创 Excel 处理技巧 - 数据合并 (五)

1、两个结构相同的数据合并(此处方法较多) (1)、pandas.concat([df1,df2,...]) # pandas.concat([df1,df2],ignore_index=True) index 即可顺延 (2)、df1.append(df2,ignore_index=True)示例(第1点):如上图所示,可以看到框中的索引的不同,下面的df3,添加了 ‘...

2019-12-04 11:00:46 287

原创 Excel 处理技巧 (四)

一、修改记录1、单值替换df.replace("B","A") #用 A 替换B也可写成:df.replace({"B":"A"})2、指定列单值替换`df.replace({"英语":"作弊","军训":"缺考"},0)`# 将英语语军训这两列的对应出现的"作弊"与"缺考"替换成“0”3、多值替换`df.replace(["b","a"],["c","d"])` ...

2019-12-04 11:00:06 241 1

原创 Excel 处理技巧 - 数据处理 (三)

一、字段抽取slice(start,stop) start 表示开始位置 stop 表示结束位置用法:df.[列名].str.slice(开始位置,结束位置)使用测试数据,我们读取“号码”一列,得到下图当我们需要从号码中抽取前3位(前3位可知道号码所属的运营商),代码如下:df = pd.read_excel(io='//mac/Home/Desktop/test/te...

2019-12-04 10:59:12 1348

原创 Excel 处理技巧 (二)

数据清洗1、重复值处理**(在多分数据合并出现重复 or 文件中对重复的数据只计算一次可用)duplicated(self,subset=None,keep='first')# keep='first' 表示除了第一次出现外,其余相同的数据都标记为重复# keep='last' 表示除了最后一次出现外,其余相同的数据都标记为重复# keep=False 表示所有相...

2019-12-04 10:58:16 346

原创 Excel 表格处理技巧(一)

不再私藏,满满的干货,希望通过分享能解决伙伴们的Excel处理问题一、关联:Vlookup (merage)vlookup是excel几乎最常用的公式,一般用于两个表的关联查询等。如若需求如下:工号,部门两列列存在于df2的表格中,所以想知道df1的每一工号对应的部门是多少。用excel的话首先确认工号是唯一值,然后在df1新增一列写:=vlookup(a2,df2!a:h,6,0) ...

2019-12-04 10:56:35 251

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除