Python通过pandas读取excel内容


pandas的介绍照搬官网:

pandas is a Python package providing fast, flexible, and expressive data structures designed to make working with “relational” or “labeled” data both easy and intuitive. It aims to be the fundamental high-level building block for doing practical, real world data analysis in Python. Additionally, it has the broader goal of becoming the most powerful and flexible open source data analysis / manipulation tool available in any language. It is already well on its way toward this goal.

本文主要是讲解如何通过pandas操作excel文件

一、数据准备

首先准备一份有数据的Excel文件:"D:\Scripts\pandas.xlsx"
内容截图如下:
在这里插入图片描述

二、数据读取
2.1、读取数据文件
xls_content = pd.read_excel("D:\\Scripts\\pandas.xlsx")
print(xls_content)

通过以上代码读出pandas.xlsx文件的所有内容
对于pandas读取excel文件有如下注释:

  1. read_excel接收除文件io外常用的 sheetname,header参数;其中sheetname代表读取excel表中的哪一个sheet,默认为第一个sheet;header 参数默认值为header=5,代表读取excel的前5行header=None 代表没有标题行,因为默认载入数据时,excel表的第一行就是标题行(pandas表结构中列的索引名称)
  2. loc:通过行标签索引行数据
  3. iloc:通过行号索引行数据

通过以下需求,读取指定的数据:

  • 查看前两行数据
xls_content = pd.read_excel("D:\\Scripts\\pandas.xlsx")
content_for_2 = xls_content.head(2)
print(content_for_2)

以上就会输出excel文档的前两行的数据

  • 打印指定单元格的内容,比如孙权的身份证号

方式一:

xls_content = pd.read_excel("D:\\Scripts\\pandas.xlsx")
content_for_2 = xls_content["身份证号"][11]
print(content_for_2)

xls_content[A][B]解释:A代表标题名称,可以理解为列名,B代表行号。所以xls_content[“身份证号”][11] 理解为excel中列名为"身份证号",行号为 11 的表格内的数据。注意pandas读取excel的是 [cols][rows] 的形式,xlrd的是 [rows][cols] 形式
方式二:

xls_content = pd.read_excel("D:\\Scripts\\pandas.xlsx", header=None)
content_for_2 = xls_content[4][12]
print(content_for_2)

注:使用方式二必须在读取文件时加入header=None,代表不使用默认标题,系统会自动写入0开始的序列补充;此时的xls_content[4][12]代表的是4列12行的数据

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值