ArcGIS10.2.2以上版本的shp数据属性表另存为无乱码的excel格式

最新推荐文章于 2025-03-14 11:11:06 发布

瘦的不像程序员

最新推荐文章于 2025-03-14 11:11:06 发布

阅读量3.3k

点赞数

分类专栏： excel 文章标签： python arcgis excel

本文链接：https://blog.csdn.net/weixin_45647889/article/details/109055847

版权

excel 专栏收录该内容

3 篇文章

订阅专栏

本文介绍了在ArcGIS10.2.2及以上版本中如何将属性表无乱码导出为Excel，提供了两种方法，包括利用ArcGIS自带工具和Python脚本。同时，分享了使用Python进行PDF多页分割的方法，可指定拆分页数和数量。这些解决方案适用于有或无ArcGIS软件的情况。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

例一：
1.背景：ArcGIS10.2.2及以上版本相比较之前版本为属性表.dbf特定了.cpg文件，用于指定特地的UTF-8编码方式，用记事本打开任意一ArcGIS10.2.2及以上版本的shp数据的.cpg文件，显示都一样，如下图所示：
在这里插入图片描述
当需要将属性表转换为excel格式时，通常在ArcGIS组件打开时，右键shp图层打开属性表—导出txt格式或dbase格式，然后再用excel打开。但是当用excel打开导出的txt格式时对于以字符型存储的较长数字来讲（例如：20位的坐落代码）会以科学技术发的形式出现；用excel打开导出的dbase格式时，由于excel使用的解码方式为跟随计算机解码方式解码，与UTF-8编码方式不同，所以对于字符型数据会出现乱码形式。所以以上两种形式都不能够满足ArcGIS10.2.2及以上版本shp数据属性表导出为excel的需求。
2.需求：将ArcGIS10.2.2以上版本的shp数据属性表另存为无乱码的excel格式。
3.解决方案一：当电脑已安装ArcGIS应用程序时，直接在搜索框内搜索工具“excel”，打开运行即可，如下图所示：
在这里插入图片描述
在有软件使用的情况下，实现excel的转换显的方便了很多，但是经常使用ArcGIS的小伙伴都知道，ArcGIS对于Excel格式数据的关联一般都是“ Microsoft Excel 5.0/95 工作簿 (.xls)” 格式，且此工具只能转换为“ Microsoft Excel 5.0/95 工作簿 (.xls)” 格式，所以其单个sheet最大储存行数为 65,535行，最大列数为256列。当需求超出最大限制时会运行失败，入下图所示：在这里插入图片描述
3.解决方案二：当未安装ArcGIS及相关组件时，将ArcGIS10.2.2以上版本的shp数据属性表另存为无乱码的excel格式：
首先新建一个文件夹作为运行目录，然后将数据（至少要有.bdf和.cpg文件）放到运行目录中，设置好dbf表名称及输出名称，然后运行。如下代码所示在桌面新建了一个名为“zhuanhuan”的文件夹，放入名为“a”的shp，运行后输出名称为a的.xls文件。运行结果及代码如图所示：

# Name: 属性表 to excel-王仁健 2020-10-13

import arcpy

# 设置目录环境
arcpy.env.workspace = "C:/Users/Administrator/Desktop/zhuanhuan"

# 设置属性表dbf及转换后的excel名称
in_table = "C:/Users/Administrator/Desktop/zhuanhuan/a.dbf"
out_xls = "a.xls"

# 输出结果
arcpy.TableToExcel_conversion(in_table, out_xls)

在这里插入图片描述
5.总结：以上两种方法在安装ArcGIS软件和无ArcGIS软件时，可满足大部分转换需求。对于“超量”数据如何解决？或有其他需求，点击关注私聊博主即可。

例二：
1.需求：将一多页数pdf分割为多个pdf。
2.解决方法一：使用pdf神器：Adobe Acrobat DC即可请松解决。
3.解决方法二：python代码解决，关于pdf拆分的代码很多很多，使人眼花缭乱，不同代码有不同局限性，有的不能指定分割页数和分割数量，有的可以实现拆分功能，但是没有清理“缓存”代码，若电脑频繁使用后会一定程度变卡。在这里给大家推荐一种方法，输入需要拆分的文件名，和拆分规则即可，如代码中拆分5-10页，拆分5份：

# pdf拆分-指定拆分页数-指定拆分数量-2020-10-13

from PyPDF2 import PdfFileReader, PdfFileWriter

def split_pdf(read_file, out_detail):
    try:
        fp_read_file = open(read_file, 'rb')
        pdf_input = PdfFileReader(fp_read_file)  
        page_count = pdf_input.getNumPages()  
        print(page_count)

        out_detail=input("aaa")

        with open(out_detail, 'r',True,'utf-8')as fp:
            txt = fp.readlines()
            for detail in txt:  
                pages, write_file = detail.split()   
                pdf_file = qqq #输入需要拆分的pdf文件名
                start_page, end_page = list(map(int, pages.split('-')))  
                start_page -= 1
                try:
                    print (5-10,pdf) #将第5页-第10页分割，储存为名称为pdf
                    pdf_output = PdfFileWriter()  
                    for i in range(start_page, end_page):
                        pdf_output.addPage(pdf_input.getPage(i))
                    with open(pdf_file, 'wb') as sub_fp:
                        pdf_output.write(sub_fp)
                    print('完成分割5页-10页，保存为pdf!') #提示框
                except IndexError:
                    print('分割页数超过了PDF的页数') #其他情况提示框
    except Exception as e:
        print(e)
    finally:
        fp_read_file.close()


split_pdf('Original.pdf', 'consult.txt')