pandas数据输入输出-保存文件cvs

DataFrame简介

DataFrame 是由列构成的二维标签数据结构,列可以有各自的数据类型,可理解为数据表,或 Series 对象构成的字典。DataFrame 也是最常用的 Pandas 对象。DataFrame 支持多种类型的输入数据:

  • 一维 ndarray、列表、字典、Series 字典
  • 二维 numpy.ndarray
  • 结构多维数组或记录多维数组
  • Series
  • DataFrame
    DataFrame还可以传递Index和Columns参数。
a = [('a',1),('b',2),('c',3)]
df = pd.DataFrame(a,columns=['descriptor', 'label'])

以元祖的方式传递数据,列分别指定为descriptor,label。index使用默认。df的格式如下:

  descriptor  label
0          a      1
1          b      2
2          c      3

数据输入输出

pandans可以输出各种格式文件:cvs、HDF5、Excel。

df.to_csv('sample.csv')

这里会在当前目录下生成文件sample.csv,如果要指定path,可以在文件名上添加绝对路径或相对路径。默认的数据格式与df保持一致,以","分隔。

,descriptor,label
0,a,1
1,b,2
2,c,3

去除默认index,以空格分隔数据,指定字符编码utf-8:

//sep是分隔符,index指定索引,false时不生成索引
df.to_csv('sample.csv',sep=' ',index=False,encoding='utf-8')

通过read_csv函数读入数据。sep参数指定分隔符,默认使用","

pd = pd.read_csv('sample.csv',sep=' ')

out:
   Unnamed: 0 descriptor  label
0           0          a      1
1           1          b      2
2           2          c      3

自动生成索引文件再读入时多了一列Unnamed: 0

// 删除之
pd.drop(["Unnamed: 0"],axis=1, inplace=True)

out:
  descriptor  label
0          a      1
1          b      2
2          c      3
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值