pandas
文章平均质量分 84
黄昏中起飞的猫头鹰
I know that i know nothing
展开
-
交易流水指标统计——pandas
3、将交易月份数大于等于2的交易对象的前两个月定义为1,2,交易月份数小于2的不定义。并匹配到原始表中,即,原始表新增一列,first_twoM。2、将上面计算的指标匹配到原始数据表中,按交易对象(人名)匹配,原始表新增上面几个指标列。总收入笔数、总收入月数、最大月收入笔数、最大月收入笔数所在日期(年月日格式)4、根据交易日期,将连续的月份定义为1,不连续定义为0。1、根据交易流水,计算每个交易交易对象的如下指标,原创 2023-07-23 20:46:19 · 395 阅读 · 0 评论 -
使用Pandas计算两个系统客户名称的相似度
如何使用Pandas库来计算两个系统中客户名称的相似度。通过将客户ID匹配后,我们可以使用字符串相似度算法来计算两列客户名称的相似程度,从而帮助我们识别和处理重复或相似的客户记录。原创 2023-07-19 21:18:22 · 1534 阅读 · 0 评论 -
客户异常数据清洗详细教程——pandas
在不同行业,我们经常会遇到数据清洗的问题,比如说我们需要清洗客户编码异常数据。这个问题是很多人都遇到的,因为很多银行的数据都是以客户为单位进行管理的,每个客户都有一个编码。那么当我们在处理这些数据的时候就会碰到这样的问题: 1.这个客户的编码一个是空的 ,另一个不为空 2.这个编码有多个不同的值的 3.这个客户的编码为空 针对这些问题,我们要对数据进行清洗。在这里我给大家推荐一个非常好用的工具: pandas。它是一个非常强大的 python库,在 pandas中有很多可以快速清洗客户编码异常数据的方法。原创 2023-07-19 11:29:51 · 284 阅读 · 0 评论 -
Pandas 日期处理:生成及去除工作日与节假日
如果你想了解如何在 Python 中高效处理日期数据,那么本篇博客一定是你不容错过的!我们将带你探索 Pandas 日期处理的精髓,包括如何创建时间序列和日期范围、如何进行日期偏移和滚动窗口操作,以及如何重采样和格式化日期数据。不仅如此,我们还将通过实例演示如何使用 Pandas 生成和过滤工作日和节假日数据。本篇博客既有趣味性又有实用性,无论你是初学者还是专家,都一定会从中受益匪浅。赶快来了解一下 Pandas 日期处理的精华吧!原创 2023-03-30 18:59:57 · 1941 阅读 · 0 评论 -
Pandas特殊连接 —— merge_ordered及merge_asof
Pandas特殊连接merge_ordered()merge_asof()原创 2023-02-17 22:36:39 · 1872 阅读 · 0 评论 -
Pandas特征工程——线性变换
线性变换Z-score变换归一化变换归一化至[0,1]归一化至[-1,1]归一化极端值处理离群值检查 LOF算法原创 2023-02-16 22:43:29 · 256 阅读 · 1 评论 -
Pandsa时间序列采样频率滑窗及重采样
Pandsa时间序列采样频率滑窗及重采样1.滑窗函数rolling()获取近7天的销售总量shift() 及 diff()2.重采样pandas.resample时间分组原创 2023-02-15 18:27:13 · 478 阅读 · 0 评论 -
Pandas时间戳与时间差
使用pd.date_range() 可以生成连续时间间隔的时间戳序列。参数有start,end,freq和periods,分别代表起始时间,终止时间,时间间隔,时间戳个数。时间单位参数有weeks、days、hours、minutes、seconds、milliseconds、microseconds、nanoseconds.能把一列时间戳格式对象转化为datetime64类型的时间戳序列。时间差序列支持与标量乘法运算、与时间差加减法和除法运算、与时间戳加减法运算。时间戳由两个时间戳相减得出。原创 2023-02-14 22:49:08 · 985 阅读 · 1 评论 -
python 自动化采集全国行政区划代码
python自动采集分析2022年中国行政区划代码原创 2023-02-10 15:03:40 · 1290 阅读 · 4 评论 -
pandas如何自定义excel格式及导出多个sheet表
pandas 默认整合XlsxWriter驱动,自动化处理excel操作,提供公式、设置单元格格式、可视化分析图片等操作# 计算每列的合适字符宽度,放到元组中(可以设置最大值)#设置每列宽度大小[worksheet.set_column(i, i, width) for i, width in enumerate(widths)] #计算的宽度,设置列宽坑:pandas.ExcelWriter默认首行颜色格式无法修改,需要删除首行后重新写入首行。原创 2023-01-21 22:20:24 · 4627 阅读 · 0 评论 -
Pandas 日期数据处理
日常工作中,日期格式有多种表达形式,比如年份开头或是月份开头2022/6/4、6/4/2022等,通过pandas的日期数据处理,可以将不同的日期格式进行统一,并进行过滤分类分析等操作,方便我们后续工作使用。原创 2022-06-04 19:25:58 · 11864 阅读 · 0 评论