参考视频:002.读取txt与csv文件_哔哩哔哩_bilibili
1. 什么是txt和csv文件?
csv和txt都属于文本文件。csv文件的字段间分别由逗号和tab键隔开;而txt文件则没有明确要求,可使用逗号/制表符/空格等多种不同的符号
2. 读取txt和csv文件
读取txt格式数据时,函数read_csv和read_table均可使用。但是使用函数read_table时需要指定分隔符sep。如果分隔符不止一种,使用正则表达式sep='\s+'。
2.1 读取csv文件
pd.read_csv(路径,sep,header,names,encoding,index_col)
pd.read_csv(路径,sep=',',header=None,names=['姓名','年龄','地址','电话','入职日期'],encoding='utf-8',index_col='入职日期')
参数:
sep:分隔符或正则化表达式sep='\s+'
header:列名的行号,默认0(即第一行),如果没有列名则header=None
names:列名,与header=None一起使用
index_col:索引的列号或列名,可以是一个单一的名称或数字,也可以是一个分层索引(list形式)
skiprows:需要跳过的行数或行号列表
encoding:文本编码,如utf-8
nrows:从文件开头处读入的行数
2.2 查看数据
import pandas as pd
path = r"F:/pandas/file1.csv"
data = pd.read_csv(path)
print(data) #查看数据
#查看前3列数据
print(data.head(3)) #默认是5行,可以指定
#查看数据的形状,返回(行数,列数)
print(data.shape) #上面查看了几行这里会写几行
#查看列名列表
print(data.columns)
#查看索引列
print(data.index)
#查看每一列数据类型
print(data.dtypes)
2.3 txt文件转csv文件
path = r"F:/pandas/file1.txt"
data = pd.read_csv(path)
data.to_csv(r"F:/pandas/file1.csv")