[Power Query] 删除重复项

这篇博客介绍了如何在PowerBI Desktop中导入数据源,并通过PowerQuery查询编辑器进行数据清洗,特别是针对‘城市’列删除重复项的步骤,以确保数据的唯一性和准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据源 

将数据源导入到Power BI Desktop,单击【转换数据】选项,进入Power Query查询编辑器界面

选中需要删重的"城市"列,鼠标右键选择【删除重复项】选项

删除重复项的结果如下图所示

PowerBI系列之Power Query专题1.  获取数据 数据源种类介绍和获取Excel数据源输入数据和拷贝数据:创建辅助表解析Json/XML数据格式获取Web网页数据和URL添加动态参数连接数据的四种模式:Import、DirectQuery、Live Connection、Dual双 属于混合模式连接数据库:Sql server、 Mysql(直连但是必须先安装一个mysql插件)DirectQuery直连查询:Sql serverODBC方式获取数据表关联或多个Sql或调用存储过程获取数据SQL中动态传参和自定义函数: sql中使用参数或数据库名称使用参数连接Sharepoint和OneDrive数据源连接Dataset和Dataflow 替换本地数据源为Sharepoint数据源并保留数据处理操作 终止当前数据刷新Loading:Cancel Query数据源设置-重置数据连接凭证PBIDS连接数据源创建和使用报表模块(输入或值列表)利用报表模板和参数控制线下报表数据权限DirectQuery启用自动页面刷新和更改检测管理聚合表提高DirectQuery查询性能动态M查询参数提高DirectQuery查询性能添加数据刷新时间 DateTime.LocalNow()和Getdate()2.  数据清洗和M语言M语言和官方文档介绍PowerQuery中查阅M函数:=#shared, Ctrl+Space提示数据清洗之常用技能:提升标题、更改数据类型、保留删除错误或空行,删除重复项、选择列和删除列、填充单元格、合并列、拆分、提取、替换、条件替换、添加自定义列,添加条件列、添加索引列、分组、添加年月日列、追加和合并查询透视和逆透视以及转置合并单元格的Excel文件处理导入文件夹中多Excel文件并合并解决多文件合并中列顺序不一致使用参数和函数批量导入文件 文本中提取中文、英文、数字等处理双引号转义 列拆分详解解决列名改变错误解决列丢失错误动态显示、排序和重命名列为所有列名添加前缀列名字母大写和分隔符调整Trim标题列中的多余空格如何处理load数据错误为什么load的Excel数据有null空行为什么load的Excel数据标题在第二行灵活添加占位符规范同类相似数据数据按多列排序为分组添加Index序号分组内值合并诊断工具分析数据处理过程PowerQuery小技巧分享 新冠病例活动轨迹地图标识 
### 解决Power Query中合并查询后的重复行 在处理Power Query中的合并查询时,如果遇到了重复行的问题,可以通过内置的功能轻松解决这个问题。当数据源被导入至Power BI Desktop并点击【转换数据】选项后,可以进入Power Query 查询编辑器界面,在这里能够执行多种数据清理和转换操作[^2]。 #### 使用删除重复项功能 对于去除重复行而言,最直接有效的方法就是利用Power Query提供的“删除重复项”工具。具体来说: - 进入Power Query 编辑器之后找到含有重复记录的数据表; - 选中那些可能存在重复值的一列或多列(如果是基于整个行来判断是否重复,则全选所有相关联的列); - 接下来点击界面上方菜单栏里的“移除”按钮组下的“删除重复项”,这样就可以快速消除完全一致的冗余条目了; 此过程不仅简化了后续分析流程,而且提高了最终报表的质量与准确性。 ```m let Source = Excel.Workbook(File.Contents("C:\path\to\yourfile.xlsx"), null, true), Sheet1_Sheet = Source{[Item="Sheet1",Kind="Sheet"]}[Data], ChangedType = Table.TransformColumnTypes(Sheet1_Sheet,{{"Column1", type text}, {"Column2", Int64.Type}}),//假设需要改变某些列类型 RemovedDuplicates = Table.Distinct(ChangedType)//这一步骤用于删除重复行 in RemovedDuplicates ``` 上述M语言脚本展示了如何通过编程方式实现相同的效果——即先加载工作簿再指定特定的工作表作为数据集的一部分,接着调整各字段的数据格式最后调用`Table.Distinct()`函数完成去重任务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值