pd.read_excel('文件名',sheetname=k,header=0,encoding=utf-8)

最新推荐文章于 2024-02-26 00:12:43 发布

GeekLeee

最新推荐文章于 2024-02-26 00:12:43 发布

阅读量2.1w

点赞数 2

分类专栏：爬虫-数据分析

本文链接：https://blog.csdn.net/GeekLeee/article/details/52810084

版权

6 篇文章 0 订阅

订阅专栏

对于存储着极为规整数据的Excel而言，其实是没必要一定用Excel来存，尽管Pandas也十分友好的提供了I/O接口。

taxidata.to_excel('t0401.xlsx',encoding='utf-8')

taxidata_from_excel = pd.read_excel('t0401.xlsx',header=0, encoding='utf-8')

taxidata_from_excel

注意：当你的xls文件行数很多超过65536时，就会遇到错误，解决办法是将写入的格式变为xlsx。excel函数受限制问题

唯一重要的参数：sheetname=k，标志着一个excel的第k个sheet页将会被取出。（从0开始）

这里介绍一些常用的参数：

读取处理：

skiprows：跳过⼀定的⾏数

nrows：仅读取⼀定的⾏数

skipfooter：尾部有固定的⾏数永不读取

skip_blank_lines：空⾏跳过

内容处理：

sep/delimiter：分隔符很重要，常⻅的有逗号，空格和Tab('\t')

na_values：指定应该被当作na_values的数值

thousands：处理数值类型时，每千位分隔符并不统⼀ (1.234.567,89或者1,234,567.89都可能)，此时要把字符串转化为

数字需要指明千位分隔符

收尾处理：

index_col：将真实的某列（列的数⺫，甚⾄列名）当作index

squeeze：仅读到⼀列时，不再保存为pandas.DataFrame⽽是pandas.Series

关注