数据清洗
文章平均质量分 51
taller_2000
不积跬步,无以至千里;不积小流,无以成江海
展开
-
Excel数据检视——对角线连续数据连线
数据表如下图所示,现需要根据规则,在符合要求的单元格上,添加连线。连续单元格位于对角线方向单元格内容相同连续单元格数量不少于7个原创 2024-09-24 12:55:17 · 676 阅读 · 0 评论 -
VBA之正则表达式(46)-- 解析业务逻辑公式
实例需求:某业务系统的逻辑公式如下所示(单行文本),保存在活动工作表的A1单元格中。现在需要按如下规则提取数据,结果如下所示。- 提取引号之间的的关键字,可能包含空格- 提取相应的操作符合: + - * / = - 提取最后的数字原创 2024-08-25 21:35:29 · 304 阅读 · 0 评论 -
使用VBA快速创建非规则数据图表
实例需求:工作表中共有4组数据,第一组数据涵盖所有日期,其他3组均为断续数据。现在需要创建如下图所示的线图,由于数据区域是非连续的,因此无法直接创建图表。需要先将数据表按照日期对齐,如下图所示,才能创建图表。原创 2024-08-25 21:32:58 · 304 阅读 · 0 评论 -
VBA快速对比数据行
实例需求:对于存在多行数据(示例中为双行)的项目,对比同一个项目的每列数据,高亮显示数据不同的单元格。原创 2024-07-29 20:13:15 · 423 阅读 · 0 评论 -
使用VBA按照指定格式快速整理多段落文档(邮件)
实例需求:客户沟通邮件,需要整理为指定格式,然后粘贴到CRM系统中。通常用户操作分为如下几步:1.拷贝邮件2.粘贴到记事本(或者其他文本编辑器)3.整理格式4.拷贝文本粘贴到CRM系统原创 2024-07-24 21:11:28 · 370 阅读 · 0 评论 -
VBA递归过程快速组合数据
实例需求:数据表包含的列数不固定,有的列(数量和位置不固定)包含组合数据,例如C2单元格为`D,P`,说明`Unit Config`有两种分别为D和P。现在需要将所有的组合罗列出来。原创 2024-06-25 00:45:39 · 619 阅读 · 0 评论 -
使用VBA实现快速梳理产品BOM
实例需求:源数据表如左图所示,包含两列:产品编号和类别,其中类别为多级列别列表,使用大于号分隔,类别级别不固定。现在需要按照列表进行拆分,产品编号依次重复,如右图所示。原创 2024-05-22 06:28:50 · 417 阅读 · 0 评论 -
VBA之正则表达式(45)-- 提取SQL语句中的函数
实例需求:数据工程师或者DBA日常工作中大量使用SQL语句,有些语句(或者存储过程)行数非常多,现在需要提取其中的所有使用了函数的相关部分,对于如下语句,需要提取Mid([编号],2,4) AS [产品]和datediff("D",[购买日期],"2024-01-01") AS [日期]两个字符串。原创 2024-04-24 13:32:39 · 421 阅读 · 1 评论 -
使用VBA快速梳理多层级族谱(组织架构)
实例需求:族谱(或者公司组织架构等)都是典型的带有层级关系数据,例如下图中左侧表格所示。- A列为层级(准确的讲是B列成员的层级),从一开始递增- B列和C列为成员直接的父(/母)子(/女)关系- D列为辅助标记现需要整理为右侧表格的形式,按照每个家族链依次排列,如标记颜色部分所示。原创 2024-03-11 03:45:54 · 802 阅读 · 0 评论 -
VBA自适应多种排班计划日期填充
实例需求:某公司有两种不同排班计划- MWF: 周一周三周五-周一周三周五...- TTS: 周二周四周六-周二周四周六...但是数据表中有时会缺少部分日期,为了便于汇总多个部分的数据,现在需要将日期补全,对于补充的日期标记为黄色。原创 2024-03-06 03:01:07 · 675 阅读 · 0 评论 -
VBA如何记录单元格中字符内容和格式
实例需求:Excel单元格中的字符可以设置不同的字体格式(大小、颜色等),有时需要将这些信息保存起来,以便于后续代码的处理(例如替换后恢复原字体颜色,或者统计某种指定格式字符个数等等),此时使用自定义数据结构就可以高效的完成这个任务。原创 2024-03-06 02:59:29 · 440 阅读 · 0 评论 -
Excel数据表定制分组排序
实例需求:某学校体育活动统计表如下图左侧表格所示,数据按照班级排列,现在需要根据如下规格对表格进行排序- “幼儿”班级排列在表格最后- 按照“次数”降序排列- “幼儿”班级同样按“次数”降序排列原创 2024-02-28 03:26:38 · 499 阅读 · 0 评论 -
VBA实现快速逆透视
将工作表中的数据(多维度交叉),对日期进行逆透视,转换为下表的格式。原创 2024-02-25 04:14:00 · 376 阅读 · 0 评论 -
VBA快速智能拆分日期
现在需要将A列日期,按照如下规则筛选,并提取开始日期和结束日期,填写在B列和C列时间段(包含起止日期)大于等于5天如果没有符合条件的时间段,B列和C列留空如果有多个符合条件的时间段,提取最后一个,例如A2单元格中,5.15-19和5.29-6.2都符合条件,那么从5.29-6.2中提取起止日期原创 2024-01-27 12:36:44 · 644 阅读 · 0 评论 -
VBA快速填充缺失数据
实例需求:数据表中F列中存在数据缺失,如下图所示。现需要根据A列中的内容(类别,图中C1、C2、B1为不同类别),补充F列数据,已知每个类别中F列存在不少于一个非空单元格,并且其内容相同。原创 2023-12-15 13:51:26 · 259 阅读 · 0 评论 -
使用VBA快速统计词组词频(多单词组合)(2/2)
实例需求:产品清单如A列所示,现在如下统计多单词组合词组词频。 在上一篇博客中[使用VBA快速统计词组词频(多单词组合)(1/2)](https://blog.csdn.net/taller_2000/article/details/134804555)讲解了如何实现双词的词频统计。本文将讲解如何实现3词的词频统计,掌握实现方法之后,可以很容易地将代码扩展到实现更多单词词频统计,实现的效果如下图所示。原创 2023-12-15 02:39:47 · 270 阅读 · 0 评论 -
快速多列查找匹配关键字
实例需求:根据第一列专业名称,在“专业分类指导目录”中,针对三个学历层次(研究生、本科生、专科生)分别查找对应专业类别,填写在对应位置,即截图中的黄色区域。原创 2023-12-15 02:02:28 · 216 阅读 · 0 评论 -
使用VBA快速统计词组词频(多单词组合)(1/2)
实例需求:产品清单如A列所示,现在如下统计词组词频。想必各位小伙伴都指定如何使用字典对象实现去重,进而实现单个单词的词频统计。但是统计词组词频就没有那么简单了,为了便于演示,此处的词组只限于两个单词的组合。提到词组,很多时候大家先想到的是如何将获取全部的组合,例如n个无重复单词,可以产生的无重复词组个数为C(n,2) ,但是在本示例中并不需要获取这些全部组合,实现思路自然也就不同了。原创 2023-12-05 13:08:42 · 315 阅读 · 0 评论 -
使用VBA快速创建日历表(时间维度表)
在数据统计分析中经常用到日历表,也有很多方法创建日历表,例如如下几篇博客分享如何使用Power Query创建日历表(相关链接参见本博文的最后部分)。本次将要分享如何使用VBA创建如下格式的日历表,需要注意的是`周次`列,其中第x周的计算需要一些技巧。原创 2023-12-05 11:52:27 · 856 阅读 · 0 评论 -
VBA快速合并更新数据
实例需求:Sheet1中的数据每日更新,Sheet2的数据为数据总表,现需要每天将Sheet1的数据更新至Sheet2中,如果Name+Color组合在Sheet2中已经存在,那么更新该行的Sales列数据,如果不是全新的数据,那么将该数据行追加到Sheet2数据表之后。原创 2023-11-17 14:26:41 · 244 阅读 · 0 评论 -
VBA如何快速识别Excel单元格中的文本数字
Excel中一种非常特殊的数字,这些数字看似数字,其实是文本格式(下文简称为文本数字),在单元格的左上角会有一个绿色小三角作为标志,如B1:B3单元格。在编程时为什么需要区分普通数字和文本数字呢?先来看以下【立即窗口】种的测试代码。A1和B1单元格内容看似相同,但是测试代码的结果却完全不同。单元格A1为普通数字,加号之后的"0"被转换为数字零,然后进行加法运算。单元格B1为文本数字,加号作为字符串连接运算符,合并两个字符串。原创 2023-11-17 13:42:07 · 1325 阅读 · 0 评论 -
VBA快速动态考勤统计
实例需求:某公司的上下班打卡记录如下所示,其中`Table_In`为上班打卡记录,`Table_Out`为下班打卡记录。现在需要根据日期整理为如下格式的考勤表。需要注意如下几点:- 每天的打卡次数不确定- 最后一列`Total/Day`统计该天的出勤总时长,忽略有缺卡的时间段- 对于缺卡记录标记为`Missing`,例如10/14,员工108500,7:59:34和14:59:34两次上班打卡记录之间并没有下班打卡记录,那么7:59:34对应的下班打卡记录为缺失原创 2023-11-04 02:07:26 · 752 阅读 · 0 评论 -
VBA之正则表达式(44)-- 拆分商品和规格
实例需求:商品组清单保存在A列中,现需要将其拆分为商品名称,保存在从B列开始的后续单元格中,部分商品包含规格,并且多种规格属性使用了逗号分隔,因此无法直接使用Excel分列功能完成数据拆分。原创 2023-11-03 01:10:26 · 362 阅读 · 0 评论 -
VBA之正则表达式(43)-- 从网页中提取指定数据
实例需求:由网页中提取下图中颜色标记部分内容,网页中其他部分与此三行格式相同。原创 2023-10-16 11:44:42 · 857 阅读 · 0 评论 -
BI神器Power Query(27)-- 使用PQ实现表格多列转换(3/3)
原始表格包含多列属性数据,现在需要将不同属性分列展示在不同的行中,att1、att3、att5为一组,att2、att3、att6为另一组,数据如下所示。原创 2023-10-02 03:22:11 · 647 阅读 · 0 评论 -
BI神器Power Query(26)-- 使用PQ实现表格多列转换(2/3)
原始表格包含多列属性数据,现在需要将不同属性分列展示在不同的行中,att1、att3、att5为一组,att2、att3、att6为另一组,数据如下所示。原创 2023-10-02 03:20:58 · 787 阅读 · 0 评论 -
BI神器Power Query(25)-- 使用PQ实现表格多列转换(1/3)
原始表格包含多列属性数据,现在需要将不同属性分列展示在不同的行中,att1、att3、att5为一组,att2、att3、att6为另一组,数据如下所示。原创 2023-10-02 03:15:56 · 778 阅读 · 0 评论 -
使用VBA实现快速模糊查询数据
实例需求:基础数据保存在`Database`工作表中,如下图所示。基础数据有37个字段,上图仅展示部分字段内容,下图中黄色字段为需要提取的数据字段。在`Search`工作表B1单元格输入查询内容。原创 2023-10-02 02:57:37 · 2974 阅读 · 0 评论 -
VBA实现Word表格排序
在Word文档的多列表格中,需要按照第一列进行排序,同时保持其他列的数据对应顺序不变。想必大家都知道,在Excel中可以简单地使用排序功能实现这种需求,但是对于Word表格则需要使用VBA代码进行处理。利用字典对象可以方便地存储表格数据,通过键值对应关系保证排序后数据顺序正确性,如果使用普通的排序算法对于二维数组排序,那么在排序过程中交换数组元素时,将打乱第2列数据的顺序。原创 2023-09-11 01:52:59 · 765 阅读 · 0 评论 -
用户权限数据转换为用户组列表(3/3) - Excel PY公式
最近Excel圈里的大事情就是微软把PY塞进了Excel单元格,可以作为公式使用,轻松用PY做数据分析。系好安全带,老司机带你玩一把。实例需求:如下是AD用户的列表,每个用户拥有该应用程序的只读或读写权限,现在需要创建新的AD用户组,并根据用户当前的权限,将这些用户添加到相应的组中。原创 2023-09-10 03:42:34 · 357 阅读 · 0 评论 -
用户权限数据转换为用户组列表(2/3) - Power Query
使用Power Query实现数据转换,如下是AD用户的列表,每个用户拥有该应用程序的只读或读写权限,现在需要创建新的AD用户组,并根据用户当前的权限,将这些用户添加到相应的组中。原创 2023-09-10 03:21:51 · 285 阅读 · 0 评论 -
用户权限数据转换为用户组列表(1/3) - VBA
实例需求:如下是AD用户的列表,每个用户拥有该应用程序的只读或读写权限,现在需要创建新的AD用户组,并根据用户当前的权限,将这些用户添加到相应的组中。原创 2023-09-10 03:05:48 · 148 阅读 · 0 评论 -
BI神器Power Query(24)-- PowerQuery动态加载M公式
Power Query 是Excel中的强大数据处理与转换工具,如果需要“动态”处理数据,大家第一时间想到的是可以使用VBA,利用代码创建M公式,进而创建PQ查询,但是复杂的M公式可能有很多行, 使用VBA处理起来并不是很方便,并且用户打开工作簿文件时必须启用宏功能,代码才能发挥作用。其实无需借助VBA,PQ内置功能就可以实现动态加载M公式,接下来使用一个简单的PQ示例进行演示。这个技巧通常用于动态执行Power Query脚本或表达式,允许在运行时构建和执行Power Query代码,以满足特定的需求原创 2023-09-02 06:51:52 · 435 阅读 · 0 评论 -
使用VBA快速比对数据
实例需求:第一行是全系列数据集合,现在需要对比第一行数据,查找第2行数据中缺失的数字,保存在第3行中。具备VBA初步使用经验的同学,都可以使用双重循环实现这个需求,这里给大家提供另一种实现思路,如何快速找到这些缺失数字。原创 2023-09-02 03:14:35 · 1174 阅读 · 0 评论 -
使用VBA字典快速计算材料配比
实例需求:每个工序需要多种部件,现在需要计算部件采购占比- 如果只有一个供货商,那么占比为100%【参见绿色行】- 如果有多个供货商,那么最低价供货商占比为70%,最高价供货商占比为30%【参见黄色区域】- 不考虑两个部件单价相同的清空- 原料列中部分数据包含@,可以忽略,即`@2`和`2`是相同的原料原创 2023-08-01 13:48:16 · 369 阅读 · 0 评论 -
VBA之正则表达式(42)-- 快速提取名称
实例需求:A列为待处理数据,现需要从中提取商品名、通用名、胰岛素笔相关信息,保存到B列至D列,需要注意如下几点:- `胰岛素笔`(E列)数据只存在于每组产品的第一行记录中,例如第2行数据中的“胰岛素笔”,对应第2~8行数据。- 商品名称可能以数字或者字母结尾,通用名可能以数字开头原创 2023-07-01 12:17:59 · 675 阅读 · 0 评论 -
VBA快速合并数据
实例需求:原始数据保存在工作表的A列至C列,现需要根据材料编号合并交付日期和交付数量,并且交付日期的日期格式采用两位数字年份简写格式,合并后的数据保存在E列和F列,如下图所示。原创 2023-07-01 12:06:41 · 817 阅读 · 0 评论 -
VBA之正则表达式(42)-- 提取代码中变量名称
实例需求:待处理代码段如下所示,现在需要提取其中的变量名称。原创 2023-06-01 12:19:54 · 878 阅读 · 0 评论 -
快速多关键字统计
本篇博客介绍了如何使用VBA代码实现在Excel工作表中对多个关键字进行快速统计的功能。通过识别每个章节所在行、确定每个章节的数据区域、统计包含关键词的单元格个数和将统计结果写入指定单元格。原创 2023-05-01 07:28:44 · 816 阅读 · 0 评论 -
单列文本数据快速导入表格
本文介绍了将单列文本数据快速导入表格的方法,该方法适用于每N行数据为一组的情况.原创 2023-05-01 07:07:47 · 1092 阅读 · 0 评论