python 将目下的excel全部转xml文件到指定的目录

        我们现在来实现将某个目录下的所有excel文件转成xml文件到指定的目录中。新生成的xml文件名称使用excel文件名。 当然这个的前提得会解析excel文件,上一篇文章说了python如何解析excel文件。这里使用python 自带的xml库:xml.dom来生成xml。

        

        由于脚本比较简单,就不细说了,代码里也有比较详细的注释。先看看excel文件所在的目录:


只需要将解析的代码稍作修改添加生成xml的代码就OK了。看看python脚本:

#! encoding=utf-8

import xlrd
import xml.dom.minidom
import os


def open_excel(file):
    try:
        data = xlrd.open_workbook(file)
        return data
    except Exception, e:
        print str(e)
        

def translate_excel_to_xml(excel_absolute_path, name, generate_xml_dir, colnnameindex=0, by_index=0):
    
    #解析excel文件
    data = open_excel(excel_absolute_path)

    #获取需要的工作表
    table = data.sheets()[by_index]        
    
    #行数
    nrows = table.nrows
    #列数
    ncols = table.ncols
    
    #创建dom文档对象
    doc = xml.dom.minidom.Document()
    
    #创建根元素
    info = doc.createElement('info')
    
    #将根元素添加到文档中区
    doc.appendChild(info)

    for nrow in range(4, nrows):
        #创建元素
        item = doc.createElement('item')
        for ncol in range(0, ncols):
            #colnames = table.col_values(ncol)
            #print colnames 
#            print table.cell(nrow, ncol).value
            key = u"%s" % table.cell(0, ncol).value
            value = table.cell(nrow, ncol).value
            if isinstance(value, float):
                value = '%0d' % value
#            print type(key), type(value)
            #将数据都作为xml中元素的属性,属性名就是第一行的值,属性值就是某一行某一列的值
            item.setAttribute(key.encode('utf-8'), value.encode('utf-8'))
#            print table.cell(0, ncol).value
        #将此元素作为根元素的子节点
        info.appendChild(item)
    
    #要生成的xml文件名
    generate_xml_name = name.strip().split('.')[0] + '.xml'
    #要生成的xml文件到某个目录的绝对路径
    geneate_xml_dir = os.path.join(generate_xml_dir, generate_xml_name)

    f = open(geneate_xml_dir, 'w')
#    doc.writexml(f)
    f.write(doc.toprettyxml())          #可以使生成xml有好看的格式,要是不需要,可以使用上一行的代码
    f.close()


def find_assign_xlsx(xlsx_path, generate_xml_dir):
    for name in os.listdir(xlsx_path):
        if name.endswith('.xlsx'):
            #生成excel文件的绝对路径
            excel_absolute_path = os.path.join(xlsx_path, name)
            #解析excel并转成xml
            translate_excel_to_xml(excel_absolute_path, name, generate_xml_dir)

            

if __name__ == "__main__":
    excel_src_path = r'D:\mobile_game_dir\newSVN\callOfSteel\trunk\Design\数据'
    generate_xml_dir = r'D:\data'

    find_assign_xlsx(excel_src_path.decode('utf-8'), generate_xml_dir)

代码其实是很简单的,代码里有很详细的注释了,这里需要特别注意的是,由于目录路径很有中文,python内部使用的unicode编码,这Windows的简体中文版本使用的中文编码不相同,需要将路径转成unicode编码,还有一种写法,这样也行find_assign_xlsx(u'D://mobile_game_dir//newSVN//callOfSteel//trunk//Design//数据', generate_xml_dir),这里没用使用r,python会将路径名转换,我直接写成左双斜杠来避免路径名出错,这个可以自己随便写。


        我这里把生成的xml文件放到D盘下的data目录中了,看看生成后的data目录吧:

很方便吧,所有的excel文件都转成xml了。为了验证是否正确,我们随便打开一个excel文件看看:


再看看D盘data目录下的道具.xml文件:

  

        可以看的出来,没什么问题。由于python的简明和第三方库强大,写这种小脚本是非常方便和简单的。

没有更多推荐了,返回首页