以各地级市(1-5线城市)人均GDP数据为例
从国家统计局或wind导出来的数据:
而我们整理后的目标sheet的匹配字段如图:
如何进行有效匹配?
观察可知:我们需要以城市名作为匹配的依据
如何将城市名批量提取出来?
这里可能会想到使用Right函数
可是城市名字符数不一致,如何确定?
观察到城市名前都有一个“:”
可以以此作为定位的依据
可是难题在于有两个“:”
所以我们首先第一步,先完成对第二个“:”的定位
以第5行攀枝花为例
首先使用substitute函数对第二个“:”进行替换
键入“=SUBSTITUTE(A5,":","*",2)”得到列B
再利用find函数对“*”进行定位
可是find函数默认从左边开始计位数
而我们需要从右边提取字符
因此需要借助len函数提取整个字段长度进行一个简单换算,并将几个函数进行嵌套
键入“=RIGHT(B5,LEN(B5)-FIND("*",B5))”
得到列C
最后,用vlookup的模糊匹配功能,可实现根据关键字匹配全称,再用xlookup函数调用数据即可
键入“=VLOOKUP("*"&D5&"*",“待查找的对应字段区间”,1,)”得到列E