我们在使用实际工作环境中进行需要处理数据,有些数据存储在excel表格中,需要人工校对或者处理工作量大且容易出错,这里我们就excel的数据处理进行说明
Python处理Excel文件主要是第三方模块库xlrd、xlwt、pyexcel-xls、xluntils和pyExcel-erator等,此外Pandas中也带有可以读取Excel文件的模块(read_excel)。这里我们只讲使用xlrd库进行读取excel数据,这里我们使用到xlrd库,可以通过pip进行安装,也可以在Settings里面Project unititled项中使用Project Interpreter 进行安装
这里我们用一份春晚节目单的excel表格当做测试数据用来调试验证
在PyCharm新建一个python文件,命名ReadExcel.py,首先导入支持库import xlrd
import xlrddef readExcel(): #读取文件 workbook = xlrd.open_workbook('春晚节目单.xls') #获取xls文件第一页签数据 sheet = workbook.sheet_by_index(0) #获取数据列数 row = sheet.nrows #获取数据行数 col = sheet.ncols print('当前xls行数=%d'%(col)) print('当前xls列数=%d'%(row)) #打印每一行的内容 for value in sheet.col_values(0): print(value)if __name__ == '__main__': readExcel()
这里只做简单数据读取,关于在实际的工作使用我们后期接着讲,由于Excel本身也不是为了海量数据的应用而产生的,在企业实际场景中,Excel本身的限制和适用,其无法存储和计算过大(例如千万级的数据记录)的数据量,但是Excel可以作为日常基本数据处理、补充数据来源或者汇总级别的数据进行读取,同时也可以作为数据结果展示的载体,这种应用下对于大量数值表格的应用效果非常好。可以说学好python后可以更好的处理表格繁杂的数据,可以节省更多的时间。