Python
挖坑的小萝卜
Less is more
展开
-
Python datetime64[ns]日期转换
问题:表A中日期格式为%Y-%m-%d %H:%M:%S(如"2021-01-01 20:00:06"),给出日期范围date_range = [‘2021-1-1’, ‘2021-1-20’],但针对这类日期格式,无法直接使用pd.date_range筛选数据。解决方案:假若只筛选日期,不需要时间数据,可以将时间重置为00:00:00,即得到“2021-01-01 00:00:00”,在这种日期格式下,pd.date_range可以实现数据筛选。#重置日期列时间格式为00:00:00data原创 2021-02-24 16:50:06 · 6261 阅读 · 0 评论 -
利用python pandas数据追加,文件重写
目的:实现文档数据滚动更新,每日将新增数据追加至表格。原逻辑:使用pd.read_excel读取A文档数据,通过append追加内容,再使用to_excel将数据写入A文档。问题:被读取的文档在python运行过程中属于打开状态,再次写入会报错:permission denied原脚本:import pandas as pddata = pd.read_excel(A, sheet_name='测试')#假设新数据集为new_datadata.append(new_data)data.to原创 2021-01-14 18:14:39 · 1582 阅读 · 1 评论 -
Python 根据条件获取多列值(文本数值通用)
照惯例先构建一个虚拟数据集。df:省份城市广东广州广东深圳广西南宁海南三亚广东珠海……需求:构建一个新列,若省份是广东,则新列内容为城市;若省份为其他,则新列内容为该省份。for index, values in df.iterrows(): df.loc[index, '新列'] = values['城市'] if values['省份']=='广东' else values['省份']...原创 2020-09-25 15:11:23 · 1433 阅读 · 0 评论 -
pandas dataframe reindex 重置行和列索引解决方法
df 数据是 pd.dataframe 类型,原格式是 >>>df.reindex(['a','b','c','d','e']) C1 C2 b 200 NaN c 200 NaN ...原创 2019-06-14 16:28:36 · 16644 阅读 · 4 评论 -
基于透视表自动化Pandas使用 (一)DataFrame 基本模块
data = pd.read_excel(r'path', sheetname=0, header=0)#读取path路径文档第一个sheet表,header=0 首行为列名dk_origin = pd.DataFrame(data, columns = ['A','B','C','D'']) #只保留源数据表的A,B,C,D列dk = dk_origin[dk_origin['A'].isi...原创 2019-06-14 14:15:45 · 463 阅读 · 0 评论 -
Python合并同类项的字符串,一对多
需求:1.通过key[公司名称]合并两张表,将订单数据写入公司信息表2.合并同个[公司名称]值下对应的不同字段多个值,为每个字段的值生成List,填入单个单元格中,效果如下图原数据视图目标数据视图...原创 2019-04-02 11:07:02 · 4608 阅读 · 0 评论 -
xlwings,set对excel多列的值去重&合并
**需求**20万条公司信息,每家公司对应四个行业细分字段,现需要对各个公司的四个细分行业数据进行整合,去除重复项,保留和合并不同值**代码实现**读写excel三方包:xlwings注意:xlwings无法处理空值,需要预先在excel中填充空值,后续可使用excel替换函数删除去重整合:setimport xlwings as xwdef open_sheet(fil...原创 2019-04-10 19:06:55 · 2333 阅读 · 2 评论 -
Python xlrd xlwt读写文档
业务逻辑1.打开文档——打开工作表2.for循环提取需要匹配的第n列每行数据3.每个数据与正则表达式匹配,匹配则True,不匹配则False4.将匹配结果写入第n+1列5.保存文档套用了re邮箱匹配正则表达式,逻辑如下"""Created on Mon Mar 18 08:58:24 2019@author: viola""&原创 2019-03-18 16:07:13 · 1441 阅读 · 0 评论 -
Python re截取字符串 xlwings将提取结果写入原表
Re模块较为全面的基础讲解https://www.cnblogs.com/yan-lei/p/7653362.html但网上很多教程和使用都没有系统全面的介绍group(),该功能非常强大问题:x=[]y = re.findall(pattern,string)x.append(y)这样对一列数据处理时会出现数据无法写入问题使用re.findall()函数 返回结果是一个内容为文本...原创 2019-03-21 15:06:40 · 1105 阅读 · 0 评论 -
xlwings处理和修改Excel已有表格数据(附xlwings空值解决思路)
https://blog.csdn.net/qq_34617032/article/details/80433939针对处理Excel的各种三方库xlrd, xlwt, xlutils, xlwings, openpyxl, xlsxwriter, win32com, DataNitro, pandas,较为全面的介绍Xlwings基础教程:https://www.cnblogs...原创 2019-03-20 16:59:30 · 10515 阅读 · 1 评论