一、思考
1.Pandas是什么?
- 功能极其强大的数据分析库
- 可以高效地操作各种数据集
- csv格式的文件
- Excel文件
- HTML文件
- XML格式的文件
- JSON格式的文件
- 数据库操作
2.经典面试题
通过面试题引出主题,读者可以思考,如果你遇到这题,该如何解答呢?
二、使用pandas来操作Excel文件
1.安装
a.通过Pypi来安装
pip install pandas
b.通过源码来安装
git clone git://github.com/pydata/pandas.git cd pandas python setup.py install
2.按列读取数据
案例中的 lemon_cases.xlsx 文件内容如下所示:
import pandas as pd # 读excel文件 # 返回一个DataFrame对象,多维数据结构 df = pd.read_excel('