python 使用openpyxl 读写xlsx

本文全文转载自:http://hi.baidu.com/chapsticks/item/773f7ae573b34f3f4ddcaf5a

 

python有很多模块都是用来操作excel的,比如xlrd,xlwt,pyExcelerator。用着很方便,但是问题是,只能支持到excel2003。虽然一般的应用其实足够了,但是如果遇到了导出大量数据(超过65535条)的需求时,excel2003就不够用了。所以我就只好去找一个能支持excel2007的模块。

google了一下,发现了这个openpyxl,不过网上也没什么中文的文档可以看,于是就自己琢磨琢磨。

I.安装

openpyxl的最新版本是1.5.0 下载地址 http://pypi.python.org/pypi/openpyxl/1.5.0

需求python的版本是2.6+ ,也就是说,如果centOS系统的机器想用,那得升级系统的python。。。

安装就是解压缩,然后cd到目录,然后

python setup.py install (安装)

II.读取excel2007文件

http://packages.python.org/openpyxl/usage.html(openpyxl使用例子)

view plaincopy to clipboardprint?

1. #-*- coding:utf-8 -*

2.

3. from openpyxl.reader.excel import load_workbook

4. import MySQLdb

5. import time

6.

7. #开始时间

8. startTime = time.time()

9.

10. #读取excel2007文件

11. wb = load_workbook(filename = r'empty_book.xlsx')

12.

13. #显示有多少张表

14. print "Worksheet range(s):", wb.get_named_ranges()

15. print "Worksheet name(s):", wb.get_sheet_names()

16.

17. #取第一张表

18. sheetnames = wb.get_sheet_names()

19. ws = wb.get_sheet_by_name(sheetnames[0])

20.

21. #显示表名,表行数,表列数

22. print "Work Sheet Titile:",ws.title

23. print "Work Sheet Rows:",ws.get_highest_row()

24. print "Work Sheet Cols:",ws.get_highest_column()

25.

26.

27. # 建立存储数据的字典

28. data_dic = {}

29.

30. #把数据存到字典中

31. for rx in range(ws.get_highest_row()):

32.

33. temp_list = []

34. pid = ws.cell(row = rx,column = 0).value

35. w1 = ws.cell(row = rx,column = 1).value

36. w2 = ws.cell(row = rx,column = 2).value

37. w3 = ws.cell(row = rx,column = 3).value

38. w4 = ws.cell(row = rx,column = 4).value

39. temp_list = [w1,w2,w3,w4]

40.

41. data_dic[pid] = temp_list

42.

43. #打印字典数据个数

44. print 'Total:%d' %len(data_dic)

注意的是ws.cell()方法,支持的参数有两种,cell(coordinate=None, row=None,column=None)

coordinate坐标,eg ws.cell("B1")

row 和 column 是行和列 ,都是从0开始

还有,如果想取得格里的值,得用ws.cell("A1").value 取到,如果用过xlrd,因为写法差不多,可能就会忘记加value了。

III.写入excel2007

view plaincopy to clipboardprint?

1. 写excel2007

2.

3. #-*- coding:utf-8 -*

4.

5.

6. import MySQLdb

7. import time

8. import sys

9. #workbook相关

10. from openpyxl.workbook import Workbook

11. #万恶的ExcelWriter,妹的封装好了不早说,封装了很强大的excel写的功能

12. from openpyxl.writer.excel import ExcelWriter

13. #一个eggache的数字转为列字母的方法

14. from openpyxl.cell import get_column_letter

15.

16.

17. #新建一个workbook

18.

19. wb = Workbook()

20. #新建一个excelWriter

21. ew = ExcelWriter(workbook = wb)

22.

23. #设置文件输出路径与名称

24. dest_filename = r'empty_book.xlsx'

25.

26. #第一个sheet是ws

27. ws = wb.worksheets[0]

28.

29. #设置ws的名称

30. ws.title = "range names"

31.

32.

33. #录入数据,注意col是数字转字母,然后需要限定%s(string型)当参数传到ws.cell()方法中去,records可以想象为一个从数据库里查询出来的数据集合

34. i=1

35. table = {}

36. for record in records:

37. for x in range(1,len(record)+1):

38. col = get_column_letter(x)

39. ws.cell('%s%s'%(col, i)).value = '%s' % (record[x-1])

40.

41. i+=1

42.

43. #又建了一个sheet,ws名字都没变,太省了。。。但是确实是一个新的sheet,不会影响之前那个sheet的东西

44. ws = wb.create_sheet()

45.

46. ws.title = 'Pi'

47.

48. ws.cell('F5').value = 3.14

49.

50.

51. #写文件

52. ew.save(filename = dest_filename)

注意的地方:

# col是用列号x为参数,调用了这个模块的get_column_letter方法算出来的字母,这个比较蛋疼。

col = get_column_letter(x)

#在为数据格赋值的时候,注意写的格式:要不会有各种不靠谱的问题出现(这个是用坐标的方式写的,其实用row ,col的方式可能没那么麻烦)

ws.cell('%s%s'%(col, i)).value = '%s' % (record[x-1])

关于该模块的API 可以查询官方文档 http://packages.python.org/openpyxl/api.html

总体来说,这个模块还是挺方便的,但是问题就是在对于python的版本有一定要求,如果在centOs上用,可能会有些问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值