恬好这几天有空,下去学习了python 脚本语言,给我的感觉是:超级shell脚本语言.
如果你已经有java/javascript语言基础,下去参考<python简明教程> ,估计三两天就可以熟识语法了.当然 python 还包含了许多的模块,包括 面向过程开发/面向对象开发/多线程/web开发/文件处理等等,这些相关模拟当然需要根据实际情况再进行深入学习了.
根据不同的需求以及不同的情况,不同的公司对其有不同的用法.大的可以用其做一些服务端主程/管理后台/web开发,小的可以用其进行日常运维工具.
关于python的语法学习就不多说了,可以根据下述这两个电子书进行自学,三五天快速阅读(记性不好的,可以中途多搞一下文档上面的例子)
<python简明教程> http://sebug.net/paper/python/index.html
<python 手册> http://man.chinaunix.net/develop/python/python2.3tut/tut
通过两天的python语法学习,再加个小项目以加固对python的理解.
要求:替换文件夹中所有xls文件的内容 .
输入:文件夹路径/需替换的key&value
-
技术预研
python编辑 xls 文件,其中一种方式是通过xlrd/xlwt/xlutils.
Python中一般使用xlrd(excel read)来读取Excel文件,使用xlwt(excel write)来生成Excel文件(可以控制Excel中单元格的格式),需要注意的是,用xlrd读 取excel是不能对其进行操作的:xlrd.open_workbook()方法返回xlrd.Book类型,是只读的,不能对其进行操作。而 xlwt.Workbook()返回的xlwt.Workbook类型的save(filepath)方法可以保存excel文件。
因此对于读取和生成Excel文件都非常容易处理,但是对于已经存在的Excel文件进行修改就比较麻烦了。不过,还有一个xlutils(依赖于xlrd和xlwt)提供复制excel文件内容和修改文件的功能。其实际也只是在xlrd.Book和xlwt.Workbook之间建立了一个管道而已,如下图:
但如果要对一个文件进行编辑,这个就有点扯蛋了.按目前我的理解是:
所谓的编辑 xls 文件,就是copy一个副本出来,并对副本进行业务编辑处理,处理结束后再进行另存为保存结果(又或者直接保存到原文件进行覆盖,而并非是直接编辑原文件. )
另外,目前遇到个问题,且未能解决:这里copy出来的副本,没办法把原文件中所包含的脚本/图片等资源,也一并复制过来.因此这样的结果是:如果文件中包含有一张图片,这样编辑过后的结果文件里面是没有插图的.
xlrd/xlwt/xlutils各模块,可以到官网下载本地进行安装 .
-
下载
下载地址:http://www.python-excel.org/
官网地址:http://www.python-excel.org/
文档地址:https://secure.simplistix.co.uk/svn/xlrd/trunk/xlrd/doc/xlrd.html
文档pdf下载:http://www.simplistix.co.uk/presentations/python-excel.pdf
-
安装
1.linux体系:(其他各模块安装与 下述xlrd模块安装一样)
$> cd xlrd-0.7.1 $> python setup.py install
-
操作
python操作excel除了读就是写。
xlrd (主要负责读取xls内容,不能更改内容 )
http://pypi.python.org/pypi/xlrd
导入
import xlrd
打开excel
file = xlrd.open_workbook('demo.xls')
查看文件中包含sheet的名称
file.sheet_names()
得到第一个工作表,或者通过索引顺序 或 工作表名称
sheet = file.sheets()[0]
sheet = file.sheet_by_index(0)
sheet = file.sheet_by_name(u'Sheet1')
获取行数和列数
nrows = sheet.nrows
ncols = sheet.ncols
循环行,得到索引的列表
for rownum in range(sheet.nrows):
print sheet.row_values(rownum)
获取整行和整列的值(数组)
sheet.row_values(i)
sheet.col_values(i)
单元格(索引获取)
cell_A1 = sheet.cell(0,0).value
cell_C4 = sheet.cell(2,3).value
分别使用行列索引
cell_A1 = sheet.row(0)[0].value
cell_A2 = sheet.col(1)[0].value
xlwt (主要负责写xls内容 )
http://pypi.python.org/pypi/xlrd
导入xlwt
import xlwt
新建一个excel文件
file = xlwt.Workbook() #注意这里的Workbook首字母是大写,无语吧
新建一个sheet
sheet = file.add_sheet('sheet name')
通过索引获取一个已存在的sheet
sheet = file.get_sheet('sheet name')
写入数据sheet.write(行,列,value)
sheet.write(0,0,'test')
如果对一个单元格重复操作,会引发
returns error:
# Exception: Attempt to overwrite cell:
# sheetname=u'sheet 1' rowx=0 colx=0
所以在打开时加cell_overwrite_ok=True解决
sheet = file.add_sheet('sheet name',cell_overwrite_ok=True)
保存文件
file.save('demo.xls')
-
项目实战
要求:替换文件夹中所有xls文件的内容 .
输入:文件夹路径/需替换的key&value
源码注释已经较为清晰了,可复制本地直接运行.另该脚本只是简单处理,只作功能实现,未对其他异常进行处理,如 文件夹中包含有 txt 等文件时的情况处理.
#!/usr/local/python
#filename:replaceFile.py
# -*- coding:utf-8 -*-
import os
import os.path
import xdrlib ,sys
import xlrd
import xlwt
import xlutils
from xlutils.copy import copy
#
# 方法:根据keyValue字典数据,对文件 ffile 进行内容替换处理
#
def parseFile(ffile,keyValue):
print "Begin parse file:",ffile
# 1 字符串替换需在同一编码下进行,保存的数据需以unicode编码保存字符串
#
#strobj.decode("cp936") -------->将s解码成unicode,参数指定的是s本来的编码方式。这个和unicode(s,encodename)是一样的。
#strobj.encode("utf-8")-------->将unicode编码成str对象,参数指定使用的编码方式
#
#
##formatting_info=True保存之前数据的格式,表示一并把样式也打开,以便下述进行copy时把样式也复制过去
wb = xlrd.open_workbook(ffile,formatting_info=True)
#这个太扯蛋了,所谓的编辑 xls 文件,就是copy一个复本出来,并对复本进行编辑过后,再进行另存为(或者直接保存到原文件进行覆盖).而没法直接编辑原文件.
#但这样的copy,却没法把原文件里面的脚本 / 图片 等一并拿出来,导致没法把这些资源转到目标文件中.
t_wb = copy(wb)
for sheetid in range(wb.nsheets):
sh = wb.sheet_by_index(sheetid)
for rownum in range(sh.nrows):
for colnum in range(sh.ncols):
cellvalue = sh.cell(rownum,colnum).value
try:
#从xls读取下来的字符串,有str unicode 两种编码串.因此需转换成同一编码(本demo是统一转成utf-8)再进行 find replace 操作.
cellvalue = getValue(cellvalue)
for keytemp,valuetemp in keyValue.items():
if isinstance(cellvalue,str) and cellvalue.find(keytemp) != -1:
cellvalue = cellvalue.replace(keytemp,valuetemp)
#写入数据时,str需转换成 unicode编码格式
t_wb.get_sheet(sheetid).write(rownum,colnum,unicode(cellvalue,"utf-8"))
except EOFError:
print "error"
except Exception,x:
print "数据类型转换失败.type:",type(value),",value:",value
print x
print "Fail parse file."
return
t_wb.save(ffile)
print "End parse file!\n\n"
def getValue(value):
if isinstance(value,unicode):
return value.encode("utf-8")
elif isinstance(value,int):
return float(value)
else:
return value
#程序从这里开始运行
if __name__== "__main__" :
#数据目录
dataDir = ""
#文件列表
fileArray = []
#替换字符串
keyValue = {}
dataDir = raw_input("Please input the datadir:")
while(True):
key = raw_input("Please input the key:")
value = raw_input("Please input the value:")
keyValue[key] = value
quit = raw_input("Please input 'quit' to quit,or other to continue:")
if quit == 'quit':
break
print "\n\n######## Message ########"
print "dataDir:",dataDir
print "keyValue",keyValue
print "\n\n#########################"
print "\n\n#########################"
print "Begin search the Dir of all file "
#parent 是指dataDir各层子目录
#dirnames 是指 parent 当层下的所有子目录
#filenames 是指 parent 当层下的所有文件
for parent,dirnames,filenames in os.walk(dataDir):
for filename in filenames:
fileArray.append(os.path.join(parent,filename))
print "There are",len(fileArray)," files.";
print "##########################\n\n"
for filename in fileArray:
parseFile(filename,keyValue)