利用NumPy和pandas对CSV文件进行写操作

数组存储成CSV之类的区隔型文件:
下面代码给随机数生成器指定种子,并生成一个3*4的NumPy数组
将一个数组元素的值设为NaN:
	In [26]: import numpy as np
	In [27]: np.random.seed(42)
	In [28]: a = np.random.randn(3,4)
	In [29]: a[2][2] = np.nan
	In [30]: print(a)
	[[ 0.49671415 -0.1382643   0.64768854  1.52302986]
	 [-0.23415337 -0.23413696  1.57921282  0.76743473]
	 [-0.46947439  0.54256004         nan -0.46572975]]

NumPy的savetxt()函数是与loadtxt()相对应的一个函数,它能以诸如CSV之类的区隔型文件格式保存数组:
	In [31]: np.savetxt('np.csv',a,fmt='%.2f',delimiter=',',header="#1,#2,#3,#4")
上面的函数调用中,我们规定了用以保存数组的文件的名称、数组、可选格式、间隔符和一个可选的标题
通过cat np.csv,可以查看刚才所建的np.csv文件的具体内容

利用随机数组来创建pandas DataFrame:
	In [38]: df = pd.DataFrame(a)
	In [39]: df
	Out[39]: 
		  0         1         2         3
	0  0.496714 -0.138264  0.647689  1.523030
	1 -0.234153 -0.234137  1.579213  0.767435
	2 -0.469474  0.542560       NaN -0.465730
pandas会自动替我们给数据取好列名
利用pandas的to_csv()方法可以为CSV文件生成一个DataFrame:
	In [40]: df.to_csv('pd.csv',float_format='%.2f',na_rep="NAN!")
对于这个方法,我们需要提供文件名、类似于NumPy的savetxt()函数的格式化参数的可选格式串和一个表示NaN的可选字符串

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值