Excel是一个强大的表格制作工具。然而我们却很难同时修改成百上千个表格,即使是重复单一相同的操作。因此,为了节省企业运营部门处理电子表单的时间成本,本文开辟一些实现excel自动化的python代码。
进行自动化需要一些前置操作,需要:1. 安装python的pandas和openpyxl库(pip或conda安装均可,环境配置按此不表);2. 推荐安装spyder作为python编译器(相比pycharm或anaconda,spyder有强大的数据可视化模块。同样使用pip或conda等安装均可)。
import pandas as pd
import openpyxl
#import路径中的csv文件
titanic = pd.read_csv(r'C:\Users\86186\Desktop\titanic.csv')
#为了方便spyder可视化,定义列表和数组
A = pd.Series()
B = pd.DataFrame()
titanic.to_excel(r'C:\Users\86186\Desktop\泰坦尼克号.xlsx')
titanic.info()
至此,我们成功将csv文件导入成为dataframe格式。
接下来我们正式开始。为了灵活剪切、复制和移动excel表格中的某些行或某些列,我们需要学习一个最基础却最重要的操作:数据切片。在此引入两个函数,loc和iloc,都可以切开某行至某行(某列至某列)的数据,但二者有轻微差别。我们知道在python中,导入dataframe时会自动为数据赋予以0开始的序号。而iloc和loc区别就在于