https://www.cnblogs.com/xiaobaixiaobai/p/10724829.html参考文献
读取excel表格数据需要用到xlrd或者openpyxl模块,所以先安装xlrd/openpyxl:直接pip install xird/openpyxl
xlrd和openpyxl区别:
1.xlrd能处理的最大行数为65535,超过这个行数的文件就需要用到openpyxl,openpyxl最大支持1048576行
2.openpyxl不支持xls格式文件
xlrd模块常用方法介绍:
打开excl文件:s = xlrd.open_workbook(“文件路径”)
获取表格:s.sheets()[0] = s.sheet_by_index(0) 获取第一张表格; 注意:下标值是从0开始
s.sheet():获取所以表单的索引
sheet = s.sheet_by_name("表名") 获取指定表名的表
获取表格的总行数:sheet.nrows
获取表格的总列数:sheet.ncols
获取指定行的数据:sheet.row_values(下标值),sheet.row_values(0,1,3)表示从去第2,3,4行的值
获取指定行的数据:sheet.col_values(下标值)
获取指定单元格数据:sheet.cell(a,b).value a表示行的下标值,b表示列的下标值;两者可以调换位置;注意:不加.value取出的值前面会带个text的东西
下边是完整的一个实例
import requests
import bs4
import re
import time
import xlwt
import xlrd
import telnetlib
import urllib
from bs4 import BeautifulSoup
from urllib import request
from urllib.request import urlopen
from my_fake_useragent import UserAgent
xlsx_path='D:/AA/b.xls'
data_xsls = xlrd.open_workbook(xlsx_path)
sheet_name = data_xsls.sheets()[0]
count_nrows = sheet_name.nrows #获取总行数
datalist = []
for i in range(1,count_nrows):
a=sheet_name.cell(i,1).value #根据行数来取对应列的值,并添加到字典中
datalist.append(a)
print(datalist[0])