Banknote Dataset(钞票数据集)介绍

Banknote Dataset(钞票数据集):这是从纸币鉴别过程中的图像里提取的数据,用来预测钞票的真伪的数据集。该数据集中含有1372个样本,每个样本由5个数值型变量构成,4个输入变量和1个输出变量。小波变换工具用于从图像中提取特征。这是一个二元分类问题。

每一行的5个(列)变量含义如下:

第一列:图像经小波变换后的方差(variance)(连续值);

第二列:图像经小波变换后的偏态(skewness)(连续值);

第三列:图像经小波变换后的峰度(curtosis)(连续值);

第四列:图像的熵(entropy)(连续值);

第五列:钞票所属的类别(整数,0或1)。

        Banknote Dataset可以从 https://archive.ics.uci.edu/ml/datasets/banknote+authentication 下载,默认是txt格式,如下是数据集前10行的数据:

3.6216,8.6661,-2.8073,-0.44699,0
4.5459,8.1674,-2.4586,-1.4621,0
3.866,-2.6383,1.9242,0.10645,0
3.4566,9.5228,-4.0112,-3.5944,0
0.32924,-4.4552,4.5718,-0.9888,0
4.3684,9.6718,-3.9606,-3.1625,0
3.5912,3.0129,0.72888,0.56421,0
2.0922,-6.81,8.4636,-0.60216,0
3.2032,5.7588,-0.75345,-0.61251,0
1.5356,9.1772,-2.2718,-0.73535,0
以下是将txt转到csv格式的python代码:
import csv

txt_file = r"../../../data/database/BacknoteDataset/data_banknote_authentication.txt"
csv_file = r"../../../data/database/BacknoteDataset/data_banknote_authentication.csv"

in_txt = csv.reader(open(txt_file, "r"), delimiter = ',')
out_csv = csv.writer(open(csv_file, 'w', encoding = 'utf8'),  lineterminator = '\n')

out_csv.writerows(in_txt)

GitHub:  https://github.com/fengbingchun/NN_Test 

  • 4
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值