read_csv()方法用来读取 csv格式的数据文件,read_table()方法则是读取通用分隔符分隔的数据文件,它们的参数相同。语法:
pandas.read_csv(filepath_or_buffer, sep=’,’, delimiter=None, header=’infer’, names=None, index_col=None, usecols=None,skiprows=None)
参数说明:
- filepath_or_buffer: str,表示文件所在位置的字符串,URL等。
- sep: str, 表示分隔符,分隔符号可以有多个,比如分隔符为"+,+“三个符号,则sep = ‘+,+’,即正则表达式 。read_csv默认分隔符为”,“,read_table默认为制表符”\t"。
- delimiter:str,默认为None。sep的别名。
- header:int,list of int,表示列名的行号。如果没有传递列名,则header = 0,列名为文件的第一行。如果显式传递了列名,则header = None。
- names:array,指定列名
- index_col:int,sequence或False。表示索引列的位置,取值为sequence则代表多重索引
- usecols:array,指定读取的列
- skiprows:从文件开头算起,需要跳过的行数
先在当前工作目录下创建csv文件,如下图可以看到这个csv文件包含三列数据,列名为studentNo,name,age。使用read_csv将这三列数据读入到DataFrame。使用cat命令显示文件内容:
读取数据
import pandas as pd
df = pd.read\_csv('01.csv')
df