问题说明
这是我在做建筑分析时遇到的一个问题。如下图左边的面,有些地形图因为时间久远或是测绘质量等问题,本来应该是连在一起的文字被打碎了。正常用【空间连接】工具的话,只会把第一顺位的单个文字连接到建筑面上,比如:【混】或者【2】。而实际我们需要的是【混2】。
解决办法
解决办法其实很简单,在【空间连接】工具的【连接要素的字段映射】中,找到【Text】,右键点击,在弹出的浮动窗口点【属性】。
在弹出的属性窗口中,找到【合并规则】,默认是【第一个】,所以只能连到一个文字。点击下拉按钮,改为【连接】即可。输入分隔符,可以在炸开的字之间插入字符,用处不大。
输出后的【Text】文本字段所得到的结果发生了变化,对比如下:
后续问题
用这个方法连接文字后,还会有一个问题。正常连接后,我们得到的文字一般是【混3、砖2……】。想要提取建筑结构的时候,只要取第一个文字就能达到目的。但是现在有可能会出现【3混、砖2……】的情况,不能保证第一个文字是结构还是层数。这时候需要用到【正则表达式】,通过提取汉字,或是提取数字,来解决这个问题。
正则表达式内容比较多,这里只给出解决本次案例所需要的代码。
提取建筑结构(即提取汉字)代码块如下:
import re
def ss(a):
result = re.findall(u'[\u4e00-\u9fa5]+', a)
if len(result) == 0:
va = ''
else:
va = ''
for i in range(0, len(result)):
va += result[i]
return va
提取建筑层数(即提取数字)代码块如下:
import re
def ss(a):
result = re.findall(r'\d', a)
if len(result) == 0:
va = ''
else:
va = ''
for i in range(0, len(result)):
va += result[i]
return va