让我们愉快的切割吧 - 1:在Power BI中使用拆分列功能对数据进行拆分

对原始数据进行整理是获取汇数据分析报表的前提,对数据进行裁剪分割是一种很常见的需求。分割指的是对于一个含有多种信息的列,按照特定的关系对其进行拆分,分割成多个列,每个列只包含特定信息。例如很多原始数据报表的地址栏都是国家/省份/城市,这一列就可以拆分成三列,以便统计每个国家或者地区,城市的相应情况。

Power BI主要提供2种column的分割方式,本文介绍第一种 –

在查询编辑器中使用拆分列功能进行分割
数据加载完毕后,在查询编辑器中有一个拆分列功能,选中所有拆分的列,点击拆分列选项即刻开始拆分工作。在下图示例中,Location一栏包含两部分信息,一部分是region,一部分是country,两部分信息用逗号(,)隔开。要拆分该列,可以使用“按分隔符”方式进行。
这里写图片描述

在按分隔符拆分列中,Power BI提供了几个设置选项。
这里写图片描述

  • 选择或输入分隔符:指定以哪种分隔符为依据进行拆分。
  • 拆分位置:如果所使用的分隔符在所要拆分的数据中多次出现,则需要指定是每次出现都要拆分,还是只在第一次出现时进行拆分。如果只在第一次出现时进行,还需要指定是以左侧为基准还是右侧为基准。例如要拆分一个文件的路径:
    \\Files\APElements\FLY\Manager\Control\Logs.txt
    此时,分隔符“斜杠”就出现了多次。在拆分时就要设置好拆分拆分规则,以便生成所需的column。
  • 在高级选项中还可以设置是将数据拆分为行还是列,如果要拆分为列,必须要指定拆分成几列。假如对示例中的location要指定拆分成3列,但实际上只有一个逗号只能拆分出两列,则Power BI会创建一个空列以满足设定的拆分3列需求。
    这里写图片描述
  • 引号字符:只有两个选择项,一个是无(None),一个是双引号。引号字符的功能是来判断当要拆分的内容中包含引用注释时,是否也要把引用的部分也进行拆分。
    举个例子,如果要拆分的内容是:亚洲,中国“包括香港,澳门以及台湾地区”,北京,如果引用字符选择的是双引号,那拆分出来的内容会变成:
    这里写图片描述
    如果引号字符选择的是无(None),则拆分之后的内容就变为:
    这里写图片描述
    需要特别注意一下,引用符合一定要使用英文的双引号,如果是中文的则不识别。

除了按照分隔符拆分以为还可以使用按字符数进行拆分,所需要配置的选项与按照分隔符进行拆分类似,需要制定字符数以及拆分方式和拆分结果(行还是列,如果是列的话,拆成多少列)
这里写图片描述
例如要拆分下面这组统计文件大小的数据,就可以用按照字符数进行,从右侧取两位字符进行分割,将数字和单位分割开来。
这里写图片描述

PowerBIPower Query专题1.  获取数据 数据源种类介绍和获取Excel数据源输入数据和拷贝数据:创建辅助表解析Json/XML数据格式获取Web网页数据和URL添加动态参数连接数据的四种模式:Import、DirectQuery、Live Connection、Dual双 属于混合模式连接数据库:Sql server、 Mysql(直连但是必须先安装一个mysql插件)DirectQuery直连查询:Sql serverODBC方式获取数据表关联或多个Sql或调用存储过程获取数据SQL动态传参和自定义函数: sql使用参数或数据库名称使用参数连接Sharepoint和OneDrive数据源连接Dataset和Dataflow 替换本地数据源为Sharepoint数据源并保留数据处理操作 终止当前数据刷新Loading:Cancel Query数据源设置-重置数据连接凭证PBIDS连接数据源创建和使用报表模块(输入或值表)利用报表模板和参数控制线下报表数据权限DirectQuery启用自动页面刷新和更改检测管理聚合表提高DirectQuery查询性能动态M查询参数提高DirectQuery查询性能添加数据刷新时间 DateTime.LocalNow()和Getdate()2.  数据清洗和M语言M语言和官方文档介绍PowerQuery查阅M函数:=#shared, Ctrl+Space提示数据清洗之常用技能:提升标题、更改数据类型、保留删除错误或空行,删除重复项、选择和删除、填充单元格、合并拆分、提取、替换、条件替换、添加自定义,添加条件、添加索引、分组、添加年月日、追加和合并查询透视和逆透视以及转置合并单元格的Excel文件处理导入文件夹多Excel文件并合并解决多文件合并顺序不一致使用参数和函数批量导入文件 文本提取文、英文、数字等处理双引号转义 拆分详解解决名改变错误解决丢失错误动态显示、排序和重命名为所有名添加前缀名字母大写和分隔符调整Trim标题的多余空格如何处理load数据错误为什么load的Excel数据有null空行为什么load的Excel数据标题在第二行灵活添加占位符规范同类相似数据数据按多排序为分组添加Index序号分组内值合并诊断工具分析数据处理过程PowerQuery小技巧分享 新冠病例活动轨迹地图标识 
好的,以下是一个简单的数据集成、清洗、转换和规约的练习: 1. 首先,我们需要准备两个数据集,一个是销售订单数据集,包含订单号、客户姓名、销售日期、销售额等信息;另一个是客户信息数据集,包含客户姓名、客户地址、客户电话等信息。 2. 在PowerBI,我们可以使用“获取数据功能,从Excel、CSV、SQL Server等数据导入数据集。我们将两个数据集导入PowerBI,然后创建一个数据模型。 3. 在数据模型,我们可以使用“关系”功能来建立两个数据集之间的关系。我们将客户姓名作为关系键,将销售订单数据集与客户信息数据集连接起来。 4. 此时,我们发现客户信息数据存在一些重复记录,需要进行数据清洗。我们可以在PowerBI使用“筛选器”功能,选择“客户姓名”,然后在“高级筛选器”选择“去除重复值”,即可将客户信息数据的重复记录删除。 5. 接下来,我们需要对销售订单数据进行数据转换。例如,我们可以添加一个“年份”,用于显示每个订单的销售年份。我们可以使用PowerBI的“衍生功能,创建一个新的“年份”,并使用公式“YEAR([销售日期])”来计算每个订单的销售年份。 6. 最后,我们还需要对数据进行规约,以确保数据的一致性和准确性。例如,我们可以使用PowerBI的“格式化”功能,设置销售额的货币格式,以确保所有金额都以相同的格式显示。 通过以上的练习,我们可以学习如何使用PowerBI进行数据集成、数据清洗、数据转换和数据规约。这些技能对于数据分析和报告非常重要。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值