自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 Power Query 自学教程

挖坑很久都没填,突然发现这篇文章阅读量很高,大半年过去了,虽然距离Power Query大神还有很远很远,但是通过学习和摸索,勉强算得上能够熟练操作80%+常用功能。在使用Power Query半年后,我个人觉得PowerQuery有以下几个优点:1.Power Query的数据处理逻辑相当于面向过程建模,将数据的处理流程固定下来,之后只需要更新源数据就能通过刷新获得经过处理的结果,能够将使...

2019-05-31 17:01:11 64683 7

原创 高考志愿决策模型

家里小朋友今年高考,最近一周全家深度沉浸式体验志愿填报,对学校和专业各抒己见(各执一词)。为了让他们battle得更有条理,我简单总结了一下高考志愿填报的因素,做了一个简单的决策模型。参考:https://download.csdn.net/download/weixin_38746818/12237642...

2021-06-30 12:34:53 761

原创 Python datetime64[ns]日期转换

问题:表A中日期格式为%Y-%m-%d %H:%M:%S(如"2021-01-01 20:00:06"),给出日期范围date_range = [‘2021-1-1’, ‘2021-1-20’],但针对这类日期格式,无法直接使用pd.date_range筛选数据。解决方案:假若只筛选日期,不需要时间数据,可以将时间重置为00:00:00,即得到“2021-01-01 00:00:00”,在这种日期格式下,pd.date_range可以实现数据筛选。#重置日期列时间格式为00:00:00data

2021-02-24 16:50:06 6285

原创 利用python pandas数据追加,文件重写

目的:实现文档数据滚动更新,每日将新增数据追加至表格。原逻辑:使用pd.read_excel读取A文档数据,通过append追加内容,再使用to_excel将数据写入A文档。问题:被读取的文档在python运行过程中属于打开状态,再次写入会报错:permission denied原脚本:import pandas as pddata = pd.read_excel(A, sheet_name='测试')#假设新数据集为new_datadata.append(new_data)data.to

2021-01-14 18:14:39 1584 1

原创 Power Query之二 可视化数据处理

终于进入正题啦~前面我们介绍了Power Query的基本情况,以及如何启动,导入并刷新数据。前文回顾: Power Query 自学教程接下来,我将介绍Power Query的数据处理功能,本篇主要围绕非数值型数据处理展开,包括日期数据,文本数据等等。日期处理在Power Query中,我们可以对日期进行各种形式的转化和提取。比如针对2021/1/14这个日期,可以进行不同操作获得以下结果:1.【年】年:2021,年份开始值:2021/1/1,年份结束值:2021/12/312.【季度】

2021-01-14 14:28:07 12367 9

原创 Python 根据条件获取多列值(文本数值通用)

照惯例先构建一个虚拟数据集。df:省份城市广东广州广东深圳广西南宁海南三亚广东珠海……需求:构建一个新列,若省份是广东,则新列内容为城市;若省份为其他,则新列内容为该省份。for index, values in df.iterrows(): df.loc[index, '新列'] = values['城市'] if values['省份']=='广东' else values['省份']...

2020-09-25 15:11:23 1436

原创 各种办公小技巧集合

网页长图截图Fn + F12 调出网页设计面板Ctrl + Shift + P 查找网页面板内置功能输入capture,出现截图相关的各种功能,单击即可运行Capture area screenshot 截取当前界面,自动保存并下载Capture full size screenshot 截取整个网页,自动保存并下载长图...

2019-09-06 13:14:42 438

原创 EXCEL 快捷键集合

不得不说 Excel 始终是数据处理界的扛把子技术门槛低,功能强大,操作灵活简单作为每天和EXCEL混 10hrs + 的数据民工,虽然用鼠标点点点处理也不慢,但总感觉快捷键用起来顺手更多,本文用来记录和分享自己在使用过程中渐渐学习or摸索到的常用快捷键~持续更新中…Ctrl + Tab:同时打开两个以上工作簿时,可快速切换工作簿Ctrl + N:新建工作簿Ctrl + W:关闭工作簿...

2019-08-29 12:01:07 495

原创 前端基础学习

H5:基本架构HTM:画图CSS:定义样式,如颜色,格式JSON:制作动态效果

2019-06-26 15:42:45 148

原创 pandas dataframe reindex 重置行和列索引解决方法

df 数据是 pd.dataframe 类型,原格式是 >>>df.reindex(['a','b','c','d','e']) C1 C2 b 200 NaN c 200 NaN ...

2019-06-14 16:28:36 16681 4

原创 基于透视表自动化Pandas使用 (一)DataFrame 基本模块

data = pd.read_excel(r'path', sheetname=0, header=0)#读取path路径文档第一个sheet表,header=0 首行为列名dk_origin = pd.DataFrame(data, columns = ['A','B','C','D'']) #只保留源数据表的A,B,C,D列dk = dk_origin[dk_origin['A'].isi...

2019-06-14 14:15:45 464

原创 Excel常用工具积累:vlookup,数据透视,countifs

**数据查找类**COUNTIF既可用于指定值,也可用于可变值,文本、数值通用,功能强大表达式 = countif (range,criteria)range:计数范围-全集,如A3:A1500,表示计数范围限定于A列第3行到第1500行criteria:计数对象,指定值如“中文”,3(数值),可变值如A3,即查找A3单元格的值在全集内出现的次数例:(特殊字符被编辑器隐藏,只能使用...

2019-04-12 18:02:46 2047

原创 xlwings,set对excel多列的值去重&合并

**需求**20万条公司信息,每家公司对应四个行业细分字段,现需要对各个公司的四个细分行业数据进行整合,去除重复项,保留和合并不同值**代码实现**读写excel三方包:xlwings注意:xlwings无法处理空值,需要预先在excel中填充空值,后续可使用excel替换函数删除去重整合:setimport xlwings as xwdef open_sheet(fil...

2019-04-10 19:06:55 2345 2

原创 Python合并同类项的字符串,一对多

需求:1.通过key[公司名称]合并两张表,将订单数据写入公司信息表2.合并同个[公司名称]值下对应的不同字段多个值,为每个字段的值生成List,填入单个单元格中,效果如下图原数据视图目标数据视图...

2019-04-02 11:07:02 4618

原创 Python re截取字符串 xlwings将提取结果写入原表

Re模块较为全面的基础讲解https://www.cnblogs.com/yan-lei/p/7653362.html但网上很多教程和使用都没有系统全面的介绍group(),该功能非常强大问题:x=[]y = re.findall(pattern,string)x.append(y)这样对一列数据处理时会出现数据无法写入问题使用re.findall()函数 返回结果是一个内容为文本...

2019-03-21 15:06:40 1113

原创 xlwings处理和修改Excel已有表格数据(附xlwings空值解决思路)

https://blog.csdn.net/qq_34617032/article/details/80433939针对处理Excel的各种三方库xlrd, xlwt, xlutils, xlwings, openpyxl, xlsxwriter, win32com, DataNitro, pandas,较为全面的介绍Xlwings基础教程:https://www.cnblogs...

2019-03-20 16:59:30 10546 1

原创 Python xlrd xlwt读写文档

业务逻辑1.打开文档——打开工作表2.for循环提取需要匹配的第n列每行数据3.每个数据与正则表达式匹配,匹配则True,不匹配则False4.将匹配结果写入第n+1列5.保存文档套用了re邮箱匹配正则表达式,逻辑如下"""Created on Mon Mar 18 08:58:24 2019@author: viola""&amp

2019-03-18 16:07:13 1441

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除