1.
引入xlrd包,调用他的open_workbook方法打开excel文件读取里面的数据,这个方法参数很多,主要是第一个,传入要解析的excel文件。
data = xlrd.open_workbook("自己的excel路径")
2.然后需要获取excel中的某个工作表,xlrd提供了三种方法:
table = data.sheets()[index] index就是就是左下角的工作表的索引顺序,从0开始。
table = data.sheet_by_index(index)
看下他们的实现发现这个和上面的其实一样的,只是上一种是data.sheets()或获取此excel中的所有表,生成一个list,再通过列表的下标取到我们需要的表。
table = data.sheet_by_name(u'sheet_name'),这个是通过表的名称来获取的
3.可以通过table.nrows来获取表的行数,table.ncols来获取表的列数
4.这样可以获取到整行的数据 talbe.row_values(index)
,index就是要获取的所在行数,返回的是一个list列表保存数据。通用的道理,table.col_values(index),就是index列的数据。返回list。
5.获取单元格的数据。通过table.cell(row_index,
col_index)可以得到excel中row_index行col_index列的数据,这样得到的其实是这样的数据:类型:
字段名(unicode编码),我们这里使用的是utf-8编码,比如我们这个excel表中的第一行第一列的table.cell(0,
0)得到的就是:text:u'itemID'。要是获取值就使用table.cell(row_index,
col_index).value即可。
由于我们这里只是简单的解析出已经存在的excel表,所以非常简单。写了非常简单的列子,将解析的数据打印出来。先看看excel文件内容
2.转化成xml文件
使用的库:python自带库xml.dom来生成xml文件
由于脚本比较简单,就不细说了,代码里也有比较详细的注释。先看看excel文件所在的目录:
只需要将解析的代码稍作修改添加生成xml的代码就OK了。看看python脚本:
#! encoding=utf-8
importxlrd
importxml.dom.minidom
importos
defopen_excel(file):
try:
data = xlrd.open_workbook(file)
returndata
exceptException, e:
printstr(e)
deftranslate_excel_to_xml(excel_absolute_path, name, generate_xml_dir, colnnameindex=0, by_index=0):
#解析excel文件
data = open_excel(excel_absolute_path)
#获取需要的工作表
table = data.sheets()[by_index]
#行数
nrows = table.nrows
#列数
ncols = table.ncols
#创建dom文档对象
doc = xml.dom.minidom.Document()
#创建根元素
info = doc.createElement_x('info')
#将根元素添加到文档中区
doc.appendChild(info)
fornrowinrange(4, nrows):
#创建元素
item = doc.createElement_x('item')
forncolinrange(0, ncols):
#colnames = table.col_values(ncol)
#print colnames
# print table.cell(nrow, ncol).value
key = u"%s"% table.cell(0, ncol).value
value = table.cell(nrow, ncol).value
ifisinstance(value, float):
value = '
'% value
# print type(key), type(value)
#将数据都作为xml中元素的属性,属性名就是第一行的值,属性值就是某一行某一列的值
item.setAttribute(key.encode('utf-8'), value.encode('utf-8'))
# print table.cell(0, ncol).value
#将此元素作为根元素的子节点
info.appendChild(item)
#要生成的xml文件名
generate_xml_name = name.strip().split('.')[0] +'.xml'
#要生成的xml文件到某个目录的绝对路径
geneate_xml_dir = os.path.join(generate_xml_dir, generate_xml_name)
f = open(geneate_xml_dir, 'w')
# doc.writexml(f)
f.write(doc.toprettyxml()) #可以使生成xml有好看的格式,要是不需要,可以使用上一行的代码
f.close()
deffind_assign_xlsx(xlsx_path, generate_xml_dir):
fornameinos.listdir(xlsx_path):
ifname.endswith('.xlsx'):
#生成excel文件的绝对路径
excel_absolute_path = os.path.join(xlsx_path, name)
#解析excel并转成xml
translate_excel_to_xml(excel_absolute_path, name, generate_xml_dir)
if__name__ =="__main__":
excel_src_path = r'D:\mobile_game_dir\newSVN\callOfSteel\trunk\Design\数据'
generate_xml_dir = r'D:\data'
find_assign_xlsx(excel_src_path.decode('utf-8'), generate_xml_dir)
代码其实是很简单的,代码里有很详细的注释了,这里需要特别注意的是,由于目录路径很有中文,python内部使用的unicode编码,这Windows的简体中文版本使用的中文编码不相同,需要将路径转成unicode编码,还有一种写法,这样也行find_assign_xlsx(u'D://mobile_game_dir//newSVN//callOfSteel//trunk//Design//数据',
generate_xml_dir),这里没用使用r,python会将路径名转换,我直接写成左双斜杠来避免路径名出错,这个可以自己随便写。
我这里把生成的xml文件放到D盘下的data目录中了,看看生成后的data目录吧:
很方便吧,所有的excel文件都转成xml了。为了验证是否正确,我们随便打开一个excel文件看看:
再看看D盘data目录下的道具.xml文件:
可以看的出来,没什么问题。由于python的简明和第三方库强大,写这种小脚本是非常方便和简单的。