Pandas基础知识(二)——读取文件的函数

1、常见的文件类型以及相应读取文件函数如下表所示:

文件类型文件后缀名读取文件函数
CSV文件.csvread_csv()
Excel文件.xlsx.xlsread_excel()
TXT文件.txtread_table()

2、假设有这么一个文件,文件名为“期末成绩统计”,表中内容如下:

姓名语文数学英语历史地理
小明102981067886
小红103107898478
小强10478889194
小兰105110996979

3、读取文件

(1)假设上述文件为csv文件,csv文件一般是以英文逗号为数据分隔符,则读取CSV文件如下:

import pandas as pd
df = pd.read_csv('期末成绩统计.csv',sep=',')

(2)假设上述文件为Excel文件,且表格存储在"成绩单"的工作表中,则读取Excel文件如下:

import pandas as pd
df = pd.read_excel('期末成绩统计.xlsx',sheet_name='成绩单', index_col=None)

(3)假设上述文件为TXT文件,则读取TXT文件如下:

import pandas as pd
df = pd.read_table('期末成绩统计.txt', sep='\t',engine='python')

4、公共参数

上述三个读取文件的函数有一些公共参数。常见的公用参数含义如下表:

ps:参数设置为其默认值时可以不写该参数

参数名参数含义详解
header文件首行
  • 默认首行为表头,即列名
  • 设置为None表示第一行不作为列名
index_col索引列
  • 默认第一列为索引列
  • index_col=['姓名','语文'],表示将姓名及语文成绩这两列设置为索引列
  • 设置为None表示无索引列
useclos读取列
  • 默认读取所有列
  • useclos=['姓名','语文'],表示只读取姓名及语文成绩这两列
parse_dates时间列
  • 需要转化为时间的列
  • parse_dates=['XX','YY'],表示将 "XX","YY"这两列转换成时间格式
nrows读取行数
  • 默认全部读取
  • nrows=100,表示读取前100行数据

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

孩子快醒醒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值