Pandas基础知识（二）——读取文件的函数

孩子快醒醒

已于 2023-06-11 13:16:32 修改

阅读量261

点赞数

分类专栏： pandas基础知识文章标签： pandas python 数据分析

于 2023-03-30 18:15:07 首次发布

本文链接：https://blog.csdn.net/m0_51981035/article/details/129773638

版权

4 篇文章 0 订阅

订阅专栏

（1）假设上述文件为csv文件，csv文件一般是以英文逗号为数据分隔符，则读取CSV文件如下：

import pandas as pd
df = pd.read_csv('期末成绩统计.csv',sep=',')

（2）假设上述文件为Excel文件，且表格存储在"成绩单"的工作表中，则读取Excel文件如下：

import pandas as pd
df = pd.read_excel('期末成绩统计.xlsx',sheet_name='成绩单', index_col=None)

（3）假设上述文件为TXT文件，则读取TXT文件如下：

import pandas as pd
df = pd.read_table('期末成绩统计.txt', sep='\t',engine='python')

上述三个读取文件的函数有一些公共参数。常见的公用参数含义如下表：

ps：参数设置为其默认值时可以不写该参数

参数名	参数含义	详解
header	文件首行	默认首行为表头，即列名设置为None表示第一行不作为列名
index_col	索引列	默认第一列为索引列 index_col=['姓名','语文']，表示将姓名及语文成绩这两列设置为索引列设置为None表示无索引列
useclos	读取列	默认读取所有列 useclos=['姓名','语文']，表示只读取姓名及语文成绩这两列
parse_dates	时间列	需要转化为时间的列 parse_dates=['XX','YY']，表示将 "XX","YY"这两列转换成时间格式
nrows	读取行数	默认全部读取 nrows=100，表示读取前100行数据