先看视频:
标注换行数据处理
一、需求背景
标注是制图中一个非常重要的内容,它是最直接的地图信息传递方式,一般用于标识某类要素的主体信息或辅助几何图形表达要素内容。在电子地图的制作中,最为常见的标注就是地名地址与兴趣点的名称标注。
对名称的标注,有一些常规约束,如每行标注的字符一般不应超过6个字,对POI名称字符长度超过6的记录,需按语义进行字符串分割等。
注记基本要求:
1) 注记,符号相互不能压盖;
2) 注记文字长度超过6个汉字时一般分行显示;
3) 根据图面负载,文字可放置在注记符号的八个方向,优先顺序分别为:右方,左方,上方,下方,右上,右下,左上,左下。
二、要素名称标注换行处理
使用Geoscene Pro或ArcGIS Pro软件中标注引擎下的自适应策略,通过设置堆叠标注的规则,实现换行标注。而堆叠标注,需要识别字符串内的分隔符,如空格,分号,逗号等。
对名称字符串添加分割符号,有两种方法,一是在不破坏名称句法关系,即在不分割词语、成语、短句等字符单元的情况下,对标注字段的属性值进行处理,在名称字符串中合适的位置添加分隔符号。二是使用类似ArcMap标注中的Expression,如使用Python 语言,对标注字符串按照间隔6个字符的方式截断,再换行标注。
第一种方法,一般采取人工干预的方式,该方法在词组划分上,结合作业人员的经验,能实现较规范、合理的断句划分,但工作量巨大。第二种方法不能合理对名称分词处理,会把词语,短句拆分开,标注效果差强人意。
使用自然语言分词实现换行标注
工具使用HanLP 的依存句法分析功能,提取词干部分,词干中的每个部分作为一个不可继续分割的实体,再顺序组合词干,以每行最接近6个字符,换行尽量少的原则对标注名称进行添加分隔符号处理。
如:"昆明西山森林公园环保大巴",依存句法解析后如下图:
换行结果为:“昆明西山,森林公园,环保大巴”。
用POI换行标注工具对点图层处理后,在属性表中添加lable_name 字段,字段值记录标注名称添加分隔符“,”后的处理结果。处理后的标注名称,完美的避免了名称字符换行时拆分词语、短语、成语或地名等字符的情况。
POI换行标注工具运行过程:
工具参数说明:
注意事项:
换行结果完全依赖于Hanlp分词结果,可能存在名称无法分词,或名称中带有特殊字符(如括号)被换行的情况。需要进一步检查,检查方式很简单,会在POI标注换行实现一文中进行讲解。
工具输出:
要素类(FeatureClass)“{要素类名称}_label”,存放在输出目录中的scratch.gdb中。若scratch.gdb不存在,则自动创建,若已存在,不会覆盖其中已有的要素。
输出结果中,增加“label_NAME”字段,用于记录换行处理的结果。
简称换行处理结果示例:
标注换行前后制图效果对比: