从零开始用python处理excel数据_从零开始使用python/pandas操作Excel (1)

对于没有编程经验的人来说,搭建开发环境就是一个难以逾越的坑。有些人可能还没真正触及编程代码就倒在了准备工作上。所以,这个系列的文章将从安装python和pandas

本文所用示例将基于Windows系统。

安装

既然python是一门编程语言,那么你需要一个针对性的编程开发环境(编程工具的集合)。这里我推荐使用Miniconda

(1) 从Miniconda的网站上下载最新版本的软件安装包,推荐使用python 3.x版本的Miniconda。图1 Miniconda下载页面

选择64-bit或者32-bit的安装包?通过 -> 查看你的操作系统的类型。图2 操作系统信息

安装中建议勾选“Add Anaconda to my PATH environment variable”。图3 Miniconda安装界面

(2) 下载并安装VS Code,就像安装普通软件一样简单。

创建自己的编程环境

同时按下Win键+R建,在弹出窗口中输入cmd,打开命令行工具。图4 开启命令行工具的命令

在命令行中输入conda create -n myenv,回车。这里myenv是环境名称,可以修改为你自己想要的名称。程序会提示新建的环境在哪个目录下。

输入conda activate myenv可以激活新建的环境。

当编程环境激活时,你会在命令行的最左侧看到(myenv)。这就提示你现在处于myenv环境中。此时的myenv环境中还没有任何编程工具。图5 命令行工具窗口

下面我们将依次安装所需要的软件包。切记,如果要让软件包安装在你新建的环境,必须先激活环境。

conda install python

conda install pandas

conda install xlrd

conda install xlwt

开启VS Code终端

假设我们有下面这张简单的数据表。

打开VS Code,随后开启终端(Terminal -> New Terminal)。图6 开启VS Code终端图7 VS Code终端

输入conda activate myenv激活新建的环境,随后输入python。图8 Python脚本环境

至此,我们已经完成了开发环境的安装,并顺利进入了开发环境。接下来就要正式开启python的编程之旅。

对Excel数据表进行简单读写操作

假设我们的数据表是下面这样的,且该数据表处于Excel文件的第一张表,表名为Sheet1。图9 简单Excel数据表示例

(1) 导入pandas库

pandas库集成了对Exce进行l操作的函数。在做任何操作之前,先将pandas导入到python开发环境中。

import pandas as pd

这里import pandas就是导入语句。as pd是将pandas的名称简写为pd,之后反复调用会更便利些。

(2) 读取数据

python只需一行代码就能读取Excel数据表。

df = pd.read_excel('指向Excel文件的路径')

这里df是一个变量

read_excel

pd.read_excel从Excel读取到的二维数据表称作DataFrame;DateFrame中的每一列称作Series。读取到的DataFrame保存在df变量中。

这里我们给read_excel函数提供了唯一的参数,即指向Excel文件的路径(从C盘根目录开始直到pandas.xlsx文件)。

最后,我们输入df变量名,看一看df里面存放了什么信息。图10 pandas读取Excel文件示例

在默认情况下(不给read_excel函数提供额外参数),pandas读取pandas.xlsx文件的第一张表,即本例中的Sheet1,同时将读取到的第一行数据视为列标题(在pandas中称为columns)。每一列前面的索引是pandas自动为每一行加上的,是由0开始的递增数列,称为index。

(3) 写入数据

向Excel写入数据表也很方便。

df.to_excel('被保存的Excel文件的路径')

注意,这里我们用到的to_excel

这里我们给to_excel函数也只提供了唯一的参数,即被保存的Excel文件的路径。如果同名文件存在,则新保存的文件会自动覆盖原同名文件。

打开被保存的Excel文件,看一看保存的数据表。图11 pandas向Excel文件写入数据的结果

在默认情况下(不给to_excel函数提供额外参数),数据会被保存在Excel文件的第一张表内,通常是Sheet1。注意,每一行的索引也被保存下来了。

小结

本节中,我们完成了开发环境的搭建,用3句代码实现了对Excel文件内容的读与写。在后续的文章中,我会更详细讲述读写函数的其它常用参数和进阶使用方法。敬请期待。Jingwei:从零开始使用python/pandas操作Excel (2)​zhuanlan.zhihu.com

参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值