Python中最常用的数据形式莫过于DataFrame了,基本上每次使用多多少少都要百度一下,终于想起了写一个DataFrame的系列文章,把DataFrame使用过的一些方法做一个系列文章,方便以后的查阅,也做一个分享。这篇博文主要介绍,DataFrame的创建方式。
目录
1.read_csv()方法
Pandas的read方法,属于一大类,大家有兴趣可以研究一下,这里只写一些简单的读取方式。
read_csv()这个方法是最常用的,一般我们都会把csv、txt数据读取到dataframe中,看下用法:
sep表示分隔符,一般情况下csv文件用逗号分隔,txt文件用table键分隔,不过具体情况要看文件的存储方式,也有可能csv文件用的是table键存储的,如果遇到读取出的dataframe都挤在一列,最大的可能就是分隔符没有用对。
header代表要不要列名,这里选择要。
#读取csv文件
df1=pd.read_csv('.../train.csv', sep=',', header='infer')
#读取txt文件
df2=pd.read_csv('.../dict.txt', sep='\t', header='infer')
看下结果:
2.read_table()方法</