系列文章目录
前言
上篇说到要求实现读取excel数据填写到表单中,selenium库学了点皮毛,接下来学学怎么操作Excel。网上一搜,操作Excel的库有很多,作为一个python新人咱也不了解哪个好用,这里就用pandas吧。
一、pandas是什么?
Pandas 是 Python 语言的一个扩展程序库,用于数据分析。
Pandas 名字衍生自术语 “panel data”(面板数据)和 “Python data analysis”(Python
数据分析)。Pandas 是一个开放源码、BSD 许可的库,提供高性能、易于使用的数据结构和数据分析工具。
Pandas 一个强大的分析结构化数据的工具集,基础是 Numpy(提供高性能的矩阵运算)。
Pandas 官网 https://pandas.pydata.org/
二、使用步骤
1.引入库
pip install pandas
import pandas as pd
frame = pd.read_excel("data.xlsx")
print(frame)
运行提示
ModuleNotFoundError: No module named ‘openpyxl’
ImportError: Missing optional dependency ‘openpyxl’. Use pip or conda to install openpyxl.
,原来pandas依赖openpyxl,并且我没有安装,那就安装一下openpyxl
pip install openpyxl
再次运行,成功。
2.数据解析
print(frame.head(2))# 读取前2行
print(frame.head(2).columns[0:3])# 读取前2行,前3列
总结
例如:以上就是Python使用pandas读取Excel的简单应用,更多使用方法后面继续探索。