python——Excel表格写入&读取数据

导入openpyxl 包

写入数据

#导入 openpyxl 包
import openpyxl
#创建excel表格
workbook = openpyxl.Workbook()
#创建表单1
worksheet = workbook.create_sheet(index=0)
#wb0 = workbook.create_sheet("user")  # 默认从后面插入一个工作表
#workbook.create_sheet(index=2,title='my_second_sheet')
#index表示这是第几张工作表,从零开始;
#title是工作表的名字

#写入内容  cell(row,column).value 表示(第几行,第几列)的值=?下标从(1,1)开始
worksheet.cell(1, 1).value = 'type'  
worksheet.cell(1, 2).value = 'x'
worksheet.cell(1, 3).value = 'y'

# 工作簿保存到磁盘
workbook.save('test.xlsx')

读取数据

from openpyxl import load_workbook # 导入模块
wb = load_workbook(filename='xb.xlsx') # 打开文件,默认可读写,若有需要可以指定write_onle和read_only为True
sheet = wb['用户表'] # 找到工作表
print(sheet['A4'].value) # 输出内容

如果是读取的时候就需要加上data_only=True,这样读到B9返回的就是数字,如果不加这个参数返回的就是公式本身.

获取行和列
sheet.row为生成器,里面是每一行数据,每一行又由一个tuple包裹

sheet.columns类似,不过里面是每一个tuple是每一列的单元格

# 因为按行,所以返回A1, B1, C1这样的顺序
for row in sheet.rows:
    for cell in row:
        print(cell.value)

# A1, A2, A3这样的顺序
for column in sheet.columns:
    for cell in column:
        print(cell.value)

以上代码就可以获得所有单元格的数据,如果要获得某行的数据,给其一个索引就行了,因为sheet.rows是生成器类型,不能使用索引,转换成list之后再使用索引,list(sheet.rows)[2]这样就获取到第三行的tuple对象.

for cell in list(sheet.rows)[2]:
    print(cell.value)

如何获得任意起见的单元格

可以使用range函数,下面的写法,获得了一A1为左上角,B3为右下角矩形区域的所有单元格,注意range从1开始的,因为openpyxl中为了Excel中的表达方式一致,并不和编程语言的习惯以0表示第一个值.

for i in range(1, 4):
    for j in range(1, 3):
        print(sheet.cell(row=i, column=j).value)
        
# out
None
None
None
None
None
None

还可以像使用切片那样使用
sheet[‘A1’:‘B3’]返回一个tuple,该元组内部还是元组,由每行的单元格构成一个元组

for row_cell in sheet_ranges['A1':'B3']:
    for cell in row_cell:
        print(cell)

导入xlwt包

写入数据

创建新的表格

import xlwt
#创建excel表格
workbook = xlwt.Workbook()
#创建表单
worksheet = workbook.add_sheet('sheet1')
#写入内容  (row,column,value)  下标从(0,0)开始
worksheet.write(0, 0, '起点')
worksheet.write(0, 1, '终点')
worksheet.write(0, 2, '出行量')

# 工作簿保存到磁盘
workbook.save('test.xlsx')

在原有的表格上写入新的数据

# 写入excle文件
workbook = open_workbook(r'C:\Users\wh\Desktop\test_new.xlsx')  # 读取Excel文件
testxlrd = workbook.sheet_by_index(0)  # 读取文件第二张工作表(从0开始)
new_workbook = copy(workbook)  # 拷贝工作表(目的是为了能够使用xlwt包,因为workbook是xlrd的open_workbook读取的,无法写入)
new_sheet = new_workbook.get_sheet(0)  # 获得拷贝文件第二张工作表(从0开始)
col = testxlrd.ncols  # 工作表总列数
for index in range(len(ytestpred)):
    new_sheet.write(index, col, ytestpred[index])  # 循环依次添加数据  write(行,列,
new_workbook.save(r'C:\Users\wh\Desktop\test_new.xlsx')

读取数据

import xlrd

def read_excel():
  # 打开文件
  workbook = xlrd.open_workbook(r'F:\demo.xlsx')
  # 获取所有sheet
  print workbook.sheet_names() # [u'sheet1', u'sheet2']
  sheet2_name = workbook.sheet_names()[1]
 
  # 根据sheet索引或者名称获取sheet内容
  sheet2 = workbook.sheet_by_index(1) # sheet索引从0开始
  sheet2 = workbook.sheet_by_name('sheet2')
 
  # sheet的名称,行数,列数
  print sheet2.name,sheet2.nrows,sheet2.ncols
 
  # 获取整行和整列的值(数组)
  rows = sheet2.row_values(3) # 获取第四行内容
  cols = sheet2.col_values(2) # 获取第三列内容
  print rows
  print cols
 
  # 获取单元格内容
  print sheet2.cell(1,0).value.encode('utf-8')
  print sheet2.cell_value(1,0).encode('utf-8')
  print sheet2.row(1)[0].value.encode('utf-8')
   
  # 获取单元格内容的数据类型
  print sheet2.cell(1,0).ctype

那么问题来了,上面的运行结果中红框框中的字段明明是出生日期,可显示的确实浮点数。好的,来解决第一个问题:

python读取excel中单元格内容为日期的方式

python读取excel中单元格的内容返回的有5种类型,即上面例子中的ctype:

ctype : 0、empty,1、string, 2、number, 3、date, 4、boolean, 5、error
即date的ctype=3,这时需要使用xlrd的xldate_as_tuple来处理为date格式,先判断表格的ctype=3时xldate才能开始操作。现在命令行看下:

>>> sheet2.cell(2,2).ctype #1990/2/22
>>> sheet2.cell(2,1).ctype #24
>>> sheet2.cell(2,0).ctype #小胖
>>> sheet2.cell(2,4).ctype #空值(这里是合并单元格的原因)
>>> sheet2.cell(2,2).value #1990/2/22
33656.0
>>> xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode)
(1992, 2, 22, 0, 0, 0)
>>> date_value = xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode)
>>> date_value
(1992, 2, 22, 0, 0, 0)
>>> date(*date_value[:3])
datetime.date(1992, 2, 22)
>>> date(*date_value[:3]).strftime('%Y/%m/%d') 
'1992/02/22'

即可以做下简单处理,判断ctype是否等于3,如果等于3,则用时间格式处理:

if (sheet.cell(row,col).ctype == 3):
  date_value = xlrd.xldate_as_tuple(sheet.cell_value(rows,3),book.datemode)
  date_tmp = date(*date_value[:3]).strftime('%Y/%m/%d')

那么问题又来了,上面 sheet2.cell(2,4).ctype 返回的值是0,说明这个单元格的值是空值,明明是合并的单元格内容"好朋友",这个是我觉得这个包功能不完善的地方,如果是合并的单元格那么应该合并的单元格的内容一样,但是它只是合并的第一个单元格的有值,其它的为空。

>>> sheet2.col_values(4)
[u'\u5173\u7cfb', u'\u597d\u670b\u53cb', '', u'\u540c\u5b66', '', '', u'\u4e00\u4e2a\u4eba', '']
>>> for i in range(sheet2.nrows):
  print sheet2.col_values(4)[i]
关系
好朋友
同学
一个人
>>> sheet2.row_values(7)
[u'\u65e0\u540d', 20.0, u'\u6682\u65e0', '', '']
>>> for i in range(sheet2.ncols):
  print sheet2.row_values(7)[i]
无名
20.0
暂无 
>>>

读取合并单元格的内容

这个是真没技巧,只能获取合并单元格的第一个cell的行列索引,才能读到值,读错了就是空值。

即合并行单元格读取行的第一个索引,合并列单元格读取列的第一个索引,如上述,读取行合并单元格"好朋友"和读取列合并单元格"暂无"只能如下方式:

>>> print sheet2.col_values(4)[1]
好朋友
>>> print sheet2.row_values(7)[2]
暂无
 >>> sheet2.merged_cells # 明明有合并的单元格,为何这里是空

疑问又来了,合并单元格可能出现空值,但是表格本身的普通单元格也可能是空值,要怎么获取单元格所谓的"第一个行或列的索引"呢?

这就要先知道哪些是单元格是被合并的!

获取合并的单元格

读取文件的时候需要将formatting_info参数设置为True,默认是False,所以上面获取合并的单元格数组为空,

>>> workbook = xlrd.open_workbook(r'F:\demo.xlsx',formatting_info=True)
>>> sheet2 = workbook.sheet_by_name('sheet2')
>>> sheet2.merged_cells
[(7, 8, 2, 5), (1, 3, 4, 5), (3, 6, 4, 5)]

merged_cells返回的这四个参数的含义是:(row,row_range,col,col_range),其中[row,row_range)包括row,不包括row_range,col也是一样,即(1, 3, 4, 5)的含义是:第1到2行(不包括3)合并,(7, 8, 2, 5)的含义是:第2到4列合并。

利用这个,可以分别获取合并的三个单元格的内容:

>>> print sheet2.cell_value(1,4)  #(1, 3, 4, 5)
好朋友
>>> print sheet2.cell_value(3,4)  #(3, 6, 4, 5)
同学
>>> print sheet2.cell_value(7,2)  #(7, 8, 2, 5)
暂无

发现规律了没?是的,获取merge_cells返回的row和col低位的索引即可! 于是可以这样一劳永逸:

>>> merge = []
>>> for (rlow,rhigh,clow,chigh) in sheet2.merged_cells:
  merge.append([rlow,clow])
   
>>> merge
[[7, 2], [1, 4], [3, 4]]
>>> for index in merge:
  print sheet2.cell_value(index[0],index[1])
   
暂无
好朋友
同学
>>>
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值