Pandas读txt和excel
一个小练习:pandas读取txt文件
read_table
read_table和read_csv类似,区别在于csv是sep以逗号为分隔,txt默认是tab作为分隔
先用help查看read_table的参数
用这几个比较常用的作为例子:
filepath_or_buffer:读取文件的位置,前缀加r(raw)表示后面是原生字符
sep:行的数据进行拆分的字符
header:以原始数据哪行做标题,无标题用names重命名列标题
names:结果重命名列标题
skiprows:从首行开始忽略跳过的行
nrows:需要读取多少行数据,如有跳过行跳过的行不算
comment:遇到指定注释符则跳过该行
例:读取桌面11.txt文档中的5行内容要求
1)跳过3行无效数据
2)标题重命名‘快捷键’
3)跳过标记为‘#’的行(这样有#则不会被读取)
结果及代码如下:
import pandas as pd
datatxt = pd.read_table(filepath_or_buffer=r'C:\Users\pg\Desktop\11.txt',
header=None, #没有标题
names=['快捷键'], #为列命名
skiprows=3, #跳过前两行
nrows=5, #读取5行
comment='#' # 跳过指定注释符号跳过该行
)
datatxt