pandas读取excel和取数

最新推荐文章于 2024-09-14 17:12:09 发布

Mark White

最新推荐文章于 2024-09-14 17:12:09 发布

阅读量1.3k

点赞数

文章标签： pandas excel python

本文链接：https://blog.csdn.net/crazyjinks/article/details/128518815

版权

pandas读取excel

经典方法-使用pd.read_excel()

注:该方法底层调用了xlrd库,因此使用此函数前,需要安装xlrd库
pip install xlrd或者conda install xlrd

参数列表
pandas.read_excel(io, sheet_name=0, *, header=0, names=None, index_col=None, usecols=None, squeeze=None, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, decimal=‘.’, comment=None, skipfooter=0, convert_float=None, mangle_dupe_cols=True, storage_options=None)

第一个参数io表示文件的路径

# 例如我们可以这样读取文件
 df=pd.read_excel("test.xlsx")

第二个参数 sheet_name,表示要读取的工作表名称.我们可以看到默认的参数是sheet_name=0, 这表示默认读取第一个工作表.

# 例如我们可以这样读取文件
 df=pd.read_excel("test.xlsx") # 读取第一张表(sheet)
 df=pd.read_excel("test.xlsx", sheet_name=0) # 读取第一张工作表(sheet)
 df=pd.read_excel("test.xlsx", sheet_name="Sheet1") # 读取名称为Sheet1的工作表
 df=pd.read_excel("test.xlsx", sheet_name=None) # 读取名称为Sheet1的工作表
 dic=pd.read_excel("test.xlsx", sheet_name=[0, 1, "Sheet5"]) # 读取名称为第一张,第二张,以及名称为Sheet1的工作表,将以字典dict类型返回

pandas取数

## 1.按列取、按索引/行取、按特定行列取
```python
import numpy as np
import pandas as pd
 
 
df=pd.DataFrame(np.arange(12).reshape((3,4)),index=['one','two','thr'],columns=list('abcd'))
 
df['a']#取a列
df[['a','b']]#取a、b列
 
#ix可以用数字索引，也可以用index和column索引
df.ix[0]#取第0行
df.ix[0:1]#取第0行
df.ix['one':'two']#取one、two行
df.ix[0:2,0]#取第0、1行，第0列
df.ix[0:1,'a']#取第0行，a列
df.ix[0:2,'a':'c']#取第0、1行，abc列
df.ix['one':'two','a':'c']#取one、two行，abc列
df.ix[0:2,0:1]#取第0、1行，第0列
df.ix[0:2,0:2]#取第0、1行，第0、1列
 
#loc只能通过index和columns来取，不能用数字
df.loc['one','a']#one行，a列
df.loc['one':'two','a']#one到two行，a列
df.loc['one':'two','a':'c']#one到two行，a到c列
df.loc['one':'two',['a','c']]#one到two行，ac列
 
#iloc只能用数字索引，不能用索引名
df.iloc[0:2]#前2行
df.iloc[0]#第0行
df.iloc[0:2,0:2]#0、1行，0、1列
df.iloc[[0,2],[1,2,3]]#第0、2行，1、2、3列
 
#iat取某个单值,只能数字索引
df.iat[1,1]#第1行，1列
#at取某个单值,只能index和columns索引
df.at['one','a']#one行，a列

2.按条件取行

选取等于某些值的行记录 用 ==
df.loc[df[‘column_name’] == some_value]
 
选取某列是否是某一类型的数值 用 isin
df.loc[df[‘column_name’].isin(some_values)]
 
多种条件的选取 用 &
df.loc[(df[‘column’] == some_value) & df[‘other_column’].isin(some_values)]
 
选取不等于某些值的行记录 用 ！=
df.loc[df[‘column_name’] != some_value]
 
isin返回一系列的数值,如果要选择不符合这个条件的数值使用~
df.loc[~df[‘column_name’].isin(some_values)]