功能需求:
使用GDAL生成shp矢量数据,并在矢量数据的要素写入中文属性值。
问题描述
问题1:导出shp文件时,会报找不到gcs.csv文件表格的异常。
问题2:解决找不到表格异常,成功导出shp文件后,使用Arcgis打开shp属性表,会发现字段中文名称正常,但中文属性值都是乱码。
原因分析:
问题1: 异常信息中也说明了可能是GDAL环境变量的设置问题,检查完环境变量和环境变量设置路径下的gcs.csv文件无误后,确定是GDAL设置环境变量时,传进去的路径因为字符编码的原因(GDAL默认是UTF-8编码读取,VS默认是GBK),被程序解析成了乱码,所以找不到路径。
问题2: 也是字符编码造成的,写入时用的UTF-8编码,当arcgis打开时,默认的其他编码格式,就会显示中文乱码。
解决方案:
问题1解决方案:
一、使用OSGeo.GDAL.Gdal.SetConfigOption("GDAL_FILENAME_IS_UTF8", "YES")
设置GDAL的路径字符是否为UTF8,来控制路径是否乱码。
网上的解决方案是在配置前直接设置一次,但是会发现你的shp导出路径,会变成乱码,然后报创建shp文件失败。
二、将传进去的字符直接转成UTF8编码格式设置到环境变量里。理论上是可行的,在调试时也可以。但不幸的是,我把程序打包后依旧报找不到表格文件。
byte[] utf8bytes = System.Text.Encoding.Default.GetBytes(gdalData);
byte[] utf8bytes2 = System.Text.Encoding.Convert(System.Text.Encoding.Default, System.Text.Encoding.UTF8, utf8bytes);
gdalData = System.Text.Encoding.Default.GetString(utf8bytes2);
也着实让人头痛,我忽然想到设置GDAL的路径字符是否为UTF8的方式,既然解析表格文件的时候路径不是UTF8格式,创建shp文件时路径是UTF8格式,那就分别在此之前用YES/NO分别对应设置,结果就可以了,打包也能正常使用。
三、还有一种方案是,中文路径无法解析的话,那就用相对路径(不包含中文难)绕过,这也是一种思路。
问题2解决方案:
一、创建图层时,设置创建编码字符的方式(这种解决方案是会在shp文件同路径下创建一个CPG文件来保存编码格式)。但是有个bug,中文属性值能被解析,但是中文字段名会出现乱码。
Gdal.SetConfigOption("SHAPE_ENCODING", "");
string[] options = new string[] { "ENCODING=UTF-8" };
Layer layer = dataSource.CreateLayer("矢量意见点", spatialReference, wkbGeometryType.wkbPoint, options);
二、直接使用SetFieldBinaryFromHexString
方法,传入HEX字符值给要素,避免中文乱码。
pointFeature.SetFieldBinaryFromHexString(0, StrToHexStr(checkResult.RuleId));
private string StrToHexStr(string str)
{
byte[] b = Encoding.Default.GetBytes(str);
string vexStr = BitConverter.ToString(b).Replace("-", string.Empty);
return vexStr;
}
这种方法能完美解决。