python3 pandas读写excel

0. 前言

Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具,能使我们快速便捷地处理数据。本文介绍如何用pandas读写excel。

1. 读取excel

读取excel主要通过read_excel函数实现,除了pandas还需要安装第三方库xlrd。

 pd.read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, parse_cols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, has_index_names=None, converters=None, dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)
 '''
 该函数主要的参数为io、sheetname、header、names、encoding。
 io:excel文件,可以是文件路径、文件网址、file-like对象、xlrd workbook;
 sheetname:返回指定的sheet,参数可以是字符串(sheet名)、整型(sheet索引)、list(元素为字符串和整型,返回字典{'key':'sheet'})、none(返回字典,全部sheet);
 header:指定数据表的表头,参数可以是int、list of ints,即为索引行数为表头;
 names:返回指定name的列,参数为array-like对象。
 encoding:关键字参数,指定以何种编码读取。
 该函数返回pandas中的DataFrame或dict of DataFrame对象,利用DataFrame的相关操作即可读取相应的数据。
 '''
 #代码示例:
 import pandas as pd
 excel_path = 'example.xlsx'
 d = pd.read_excel(excel_path, sheetname=None)
 print(d['sheet1'].example_column_name)

2. 写入excel

写入excel主要通过pandas构造DataFrame,调用to_excel方法实现。

DataFrame.to_excel(excel_writer, sheet_name='Sheet1', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, startrow=0, startcol=0, engine=None, merge_cells=True, encoding=None, inf_rep='inf', verbose=True, freeze_panes=None)
'''
该函数主要参数为:excel_writer。
excel_writer:写入的目标excel文件,可以是文件路径、ExcelWriter对象;
sheet_name:被写入的sheet名称,string类型,默认为'sheet1';
na_rep:缺失值表示,string类型;
header:是否写表头信息,布尔或list of string类型,默认为True;
index:是否写行号,布尔类型,默认为True;
encoding:指定写入编码,string类型。
'''
import pandas as pd
writer = pd.ExcelWriter('output.xlsx')
df1 = pd.DataFrame(data={'col1':[1,1], 'col2':[2,2]})
df1.to_excel(writer,'Sheet1')
writer.save()
  • 17
    点赞
  • 105
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: Python3中使用Pandas库可以Excel数据。具体步骤如下: 1. 安装Pandas库 在终端中输入以下命令: ``` pip install pandas ``` 2. 导入Pandas库 在Python代码中导入Pandas库: ```python import pandas as pd ``` 3. Excel数据 使用Pandas库中的read_excel()函数可以Excel数据。例如,取名为“data.xlsx”的Excel文件: ```python df = pd.read_excel('data.xlsx') ``` 其中,df是一个DataFrame对象,包含了Excel文件中的所有数据。 4. 处理Excel数据 可以使用Pandas库中的各种函数对Excel数据进行处理,例如筛选、排序、统计等操作。 ```python # 筛选出“年龄”列大于20的数据 df[df['年龄'] > 20] # 按“年龄”列升序排序 df.sort_values('年龄', ascending=True) # 统计“性别”列中男女人数 df['性别'].value_counts() ``` 以上就是Python3中使用PandasExcel数据的基本步骤。 ### 回答2: Python是一种非常流行的编程语言,广泛应用于数据分析、人工智能等领域。在数据处理方面,Python中的pandas库是非常常用的一个工具,可以Excel文件中的数据并进行处理。 首先,我们需要安装pandas库。在命令行中输入以下命令: ```python pip install pandas ``` 成功安装后,我们就可以开始Excel数据了。使用pandas库中的read_excel函数来Excel文件,该函数有两个必选参数:文件路径和要取的表单名称。 ```python import pandas as pd filepath = "excel_file.xlsx" df = pd.read_excel(filepath, sheet_name="Sheet1") ``` 上述代码中,我们通过 pd.read_excel() 函数取了 excel_file.xlsx 文件中的 Sheet1 表单数据,并将其存储在变量 df 中。此时,变量 df 就是一个 pandas中的 DataFrame类型,我们可以像操作普通的二维数组一样对其进行操作。 为了进一步了解pandas的数据处理能力,我们可以使用一些基本的pandas操作,例如, 1. 查看数据结构: ```python # 查看前5条数据 print(df.head()) # 查看数据行数和列数 print(df.shape) # 查看每列的数据类型 print(df.dtypes) # 查看列名 print(df.columns) # 查看数据统计信息 print(df.describe()) ``` 2. 选择数据 ```python # 选择一列数据 col = df['column1'] # 选择多列数据 cols = df[['column1', 'column2']] # 选择一行数据 row = df.loc[0] # 选择多行数据 rows = df.loc[0:5] # 选择特定位置的数据 value = df.loc[0, 'column1'] ``` 3. 数据处理 ```python # 新增一列数据 df['new_column'] = df['column1'] + df['column2'] # 修改数据 df.loc[0, 'column1'] = "new_value" # 删除一列数据 df = df.drop('column1', axis=1) # 根据条件筛选数据 select_rows = df[df['column1'] > 10] # 合并两个DataFrame df2 = pd.read_excel('excel_file2.xlsx') df3 = pd.merge(df1, df2, on='key_column') ``` 通过这些操作,我们可以实现对Excel文件中的数据进行自由处理和转换。当然,本篇只是对pandasExcel数据和基本操作的简单介绍,pandas库具有非常强大的数据处理及分析功能,在实际业务场景中,可以使用pandas库轻松处理各种数据。 ### 回答3: Python 是一门非常流行的编程语言,而 Pandas 则是 Python 语言的一个数据分析工具包。在 Pandas 中,Excel 数据非常方便,我们只需要使用 read_excel 函数即可实现。下面来详细介绍如何使用 Pandas Excel 数据。 首先,我们需要安装 Pandas,打开终端(Windows 用户为命令行),输入以下命令即可安装: ``` pip install pandas ``` 安装完成后,我们可以使用 Pandas 的 read_excel 函数来Excel 数据。其中,read_excel 函数需要指定 Excel 文件的路径以及数据表所在的 sheet 名称,具体代码如下所示: ``` import pandas as pd df = pd.read_excel('path/to/excel/file.xlsx', sheet_name='Sheet1') ``` 其中,'path/to/excel/file.xlsx' 表示 Excel 文件所在的路径,'Sheet1' 表示数据表所在的 sheet 名称。取完成后,我们将数据存储在变量 df 中。 除此之外,read_excel 函数还可以指定一些其他参数,以满足不同的需求。例如,我们可以使用 header 参数来指定哪一行作为数据表的表头。如果数据表没有表头,我们可以将 header 参数设置为 None,这样 Pandas 将使用默认的表头(即从 0 开始的整数)。 下面是一个完整的示例代码,Excel 数据并输出前 5 行: ``` import pandas as pd df = pd.read_excel('path/to/excel/file.xlsx', sheet_name='Sheet1', header=0) print(df.head()) ``` 通过 Pandas 的 read_excel 函数,我们可以轻松地Excel 数据,并进行数据分析和处理,从而实现更加高效和准确的数据分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值