【数据分析】Pandas处理excel--导入+保存xlsx

首先安装好pandas(pip命令安装)
本节案例数据表lesson4.xlsx
在这里插入图片描述

Section 1 导入数据

  • 用的pandas的read_x()方法,x表示待导入文件的格式
  • 导入.xlsx文件,使用read_excel()
# 文件路径
filePath = "../test1/lesson4.xlsx"
# 读入数据
df = pd.read_excel(filePath)
# 指定sheet名称读入数据
df = pd.read_excel(filePath, sheet_name = "观看数据")    # 读取名为“观看数据”的sheet
# 指定第几个sheet读取,从0开始
df = pd.read_excel(filePath, sheet_name = 0)    # 读取第一个sheet
# 打印
# print(df)
df

运行结果:
运行结果如图

# 指定哪一列为行索引
# 上一个案例没有指定行索引,默认加一列0-4
df = pd.read_excel(filePath, index_col = 0)    # 第一列作为行索引
df

运行结果:
在这里插入图片描述

# 指定哪一行为列索引
df = pd.read_excel(filePath, header = 0)    # 第一列作为列索引,不指定也是默认第一行
df

运行结果:
在这里插入图片描述

# 指定需要导入的列
df = pd.read_excel(filePath, usecols = [0,3])   # 只导入第一列和第四列
df
# 当数据很庞大时,只导入所需要的列可以提高数据处理速度

运行结果:
在这里插入图片描述

Section 2 了解数据内容

# head()方法控制显示前几行,默认5行数据
df = pd.read_excel(filePath, sheet_name = "观看数据")
# df.head()    # 前5行(不包括title)
df.head(3)    # 前3行(不包括title)

运行结果:
在这里插入图片描述

# shape属性获取数据表大小,返回元组
print(df.shape)
# 结果:(5, 5)  5行5列数据,不包括title

# infor()方法获取数据类型
print(df.info())
'''
结果解释:
该表格是DataFrame类型
共5条数据,索引0~4
共5列
下面列出了5列的名称、是否有空值、数据类型
'''

info()运行结果:
在这里插入图片描述

# describe()方法获取数据分布
print(df.describe())

运行结果:
在这里插入图片描述

Section 3 保存数据

  • 数据经过自己的处理之后,需要保存成新的excel表
df = pd.read_excel(filePath, sheet_name = "观看数据")
# 将df保存为excel,文件名、sheet名称,index=False去掉行索引(不然自动生成的0-4会到新表,)
# na_rep = 0 如果某些单元格没有数值,填充为0
# inf_rep = 0 如果某些单元格时无穷之,填充为0
df.to_excel("new_sheet.xlsx", sheet_name = "new_sheet", index = False, na_rep = 0, inf_rep = 0)

上述代码完成后,生成new_sheet.xlsx

  • 0
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值