Troubleshooting：Shapefile 乱码与字符截断问题

最新推荐文章于 2022-07-29 14:09:05 发布

kikita

最新推荐文章于 2022-07-29 14:09:05 发布

阅读量7.8k

点赞数 1

分类专栏： GeoData Management 文章标签：乱码编码 arcgis shapefile 截断

本文链接：https://blog.csdn.net/kikitamoon/article/details/50326415

版权

本文详细介绍了在ArcGIS 10.3中打开shapefile出现乱码的原因和解决方案，包括在缺少LDID和CPG文件时，如何创建CPG文件指定正确的编码。此外，还解释了为何从ArcGIS 10.3开始，字段名被截断成3个汉字，这是由于从10.2.1版开始默认使用UTF-8编码导致的。最后，提供了一种通过Python检测shapefile编码类型的简单方法，并给出了代码示例。

摘要由CSDN通过智能技术生成

Shapefile是上个世纪90年代的数据格式，但是由于它开放易用至今仍然倍受欢迎，最近与shapefile编码相关的问题此起彼伏连绵不绝，整理下几个高频问题共享之。

为什么我的shapefile在ArcGIS 10.3中打开乱码？

原因

这个问题的根本原因就是读取文件使用的编码类型和文件实际存储的编码类型不一致。

Shapefile文件的头文件（dBase Header）中，一般会包含shapefile使用的编码类型的信息，这个信息成为 LDID （ Language Driver ID），这样在使用应用程序打开 shapefile 的时候，应用程序就知道用何种编码类型去正确读取它，而不会发生乱码。在 ArcGIS Desktop 生产的 shapefile 数据中通常会包含这项信息。在Shapefile的子文件中，有时我们还会发现同名 *.cpg 文件，文件中也存储了编码信息，用记事本打开，看到例如 utf-8。

二者被ArcGIS 识别的优先顺序是，LDID 优先于 CPG文件。也就是如果头文件中没有约定读shapefile的编码类型时，如果这时刚好有个CPG文件，那么ArcGIS就会使用这里的编码类型读取。

我们知道 shapefile 是个开放格式，只要你了解了数据规范，完全可以脱离ArcGIS自己生产出来。在Windows中文语言设置下，假设你自己写代码或者使用第三方的程序生产了shapefile，例如MapGIS&#