Power Query中用正则表达式,让处理文本利器得到发挥
拿个实例来尝试下,提取手机号码:
代码 | 说明 |
Excel.CurrentWorkbook(){[Name="表1"]}[Content] | 导入到Power Query中 |
代码 | 说明 |
Table.AddColumn(源, "手机号", each _) | 增加一列,先each _导入对应记录 |
代码 | 说明 |
Table.AddColumn(源, "手机号", each _[姓名]) | 深化到值, 可理解为复制了一列,然后对复制此列的值进行操作 |
代码 | 说明 |
Table.AddColumn(源, "手机号", each Web.Page( " | 利用Web.Page("")导入正则,双引号,单引号,\d提取数字。此步为关键 |
代码 | 说明 |
Table.AddColumn(源, "手机号", each Web.Page( " | 一步一步深化内容 |
代码 | 说明 |
Table.AddColumn(源, "手机号", each Web.Page( " | 继续深化 |
代码 | 说明 |
Table.AddColumn(源, "手机号", each Web.Page( " | 再深化 |
代码 | 说明 |
Table.AddColumn(源, "手机号", each Web.Page( " | 最里层的深化,即我们所需要的已经深化出来。\d即所有的数字 |
代码 | 说明 |
Table.AddColumn(源, "手机号", each Web.Page( " | 修改一下,不是要所有的数字,是需要十一位的数字,\d{11}即11位数字。手机号码为11位的数字,提取成功。 完成! |
再举一例,如下拆成表格,用正则表达式会比较简单,但直接只用Power Query将颇费周单。
练习文档在此,
链接:https://pan.baidu.com/s/1NMPDZLypxziEqI4zkyA6KA
提取码:1214