Excel是微软的经典之作,几乎可以满足我们日常工作的所有需求,但是在处理海量数据时,Excel在效率及性能方面就显得很吃力。正因为Pandas在数据处理方面有着独特的优势,所有掌握pandas库处理excel格式的数据就显得十分必要。
目录excel文档新建
读取excel文档
行列操作
空值自动填充
行列函数运算
excel数据排序
excel数据按条件筛选
# 1. 创建excel文件
在jupyter中导入pandas模块,新建一个aaa.xls的excel文件
这里注意以下点:
1> window中使用反斜杠 \不表示目录路径,这里使用正斜杠 /
2> 定义index时,column的名称与定义时保持一致
3> excel文件后缀 .xlsx可能会报错,建议采用 .xls新建excel文件
# 2. 读取excel文件
1> 读取常规的excel数据表,查看文档行列信息读取excel
2> header
数据表sheet头部有空值或者其他无用的数据,通过定义 header 的数值来指定开始读取的行。
header = 2 :表示从数据表sheet的第3行开始读取header
3> 重命名列
(1)将给定的Sheet数据表的杂乱命名进