1.读取excel
这里介绍一个简单易行的方法,需要用到xlrd这个package,利用的函数是xlrd.open_workbook(“path”)
import xlrd
def read_excel():
file = xlrd.open_workbook(r"path") ##r表示转义,path表示文件的路径
data = file.sheet_by_name('Sheet1') ##用工作表的名称来调取需要读取的数据,这里需要Sheet1里的数据
print(data.name, data.nrows, data.ncols) ##用于打印工作表名称、行数、列数
read_excel()
但这里可能会遇到问题,xlrd这个库在更新到2.0版本后无法读取xlsx类型的文件。处理方法很简单,只需要卸载现在的xlrd库,并安装以前的版本即可,具体步骤如下:
①用windows+R键打开运行,并输入cmd进入命令提示窗。②输入pip uninstall xlrd,系统会提示xlrd已卸载。③输入pip install xlrd==1.2.0即可安装旧版本xlrd
接下来进行数据的调取:
## -*-coding:utf-8-*-##
from numpy import array
import numpy as np
import xlrd
def read_excel():
file = xlrd.open_workbook(r"path")
table = file.sheet_by_name('Sheet1') ##用工作表的名称来调取需要读取的数据,这里需要Sheet1里的数据
print(table.name, table.nrows, table.ncols) ##用于打印工作表名称、行数、列数
excel_data = []
for i in range (0, table.nrows):
row_data = table.row_values(i)
excel_data.append(row_data)
excel_data = array(excel_data)
print(excel_data)
read_excel()
从而excel文件里的数据就以矩阵的形式完整保存在excel_data里了。
当然,xlrd库里还提供了很多对读取数据进行筛选的工具
row或col都有完整数值和切片几种选项