将自己的图像数据转为mnist可用

自己有一些图像数据,想在TensorFlow上跑,但是需要预处理,于是昨天弄了一会才把预处理弄完,很渣,仅供参考。

利用pandas.read_csv( )之后,变成了x_train(None,784)与y_train(None,1)【label标志】,导入之后是dataFrame格式,现在要把y_train变为(None,10)。


1、先导入数据

x_data = pd.read_csv('../train.csv')
y_train = (x_data['label'])
x_train = x_data.drop('label', 1)


2、将x_train归一化

x_train = x_train/float(255)

3、利用DictVectorize()转换y_train,由于DictVectorize对[ {str:str1},{str:str2}...] 可以转为n个特征量,特征值为0、1,而对[ {str:int1},{str:int2},... ] 只会转为一个特征量str,然后int为特征值,故需要先将y_train转换为dataFrame(一开始为Series),然后将int转为str,即可用DictVectorize

dv = DictVectorizer(sparse=False)
y_train = y_train.to_frame()
y_train['label'] = y_train['label'].astype(str)
y_train = y_train.to_dict(orient='record')
y_train = dv.fit_transform(y_train)


现在就可以用sess的run了

python sklearn-03:特征提取方法基础知识




  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值