Banknote Dataset(钞票数据集)介绍

最新推荐文章于 2024-08-08 07:45:18 发布

fengbingchun

最新推荐文章于 2024-08-08 07:45:18 发布

阅读量6.6k

点赞数 4

分类专栏： Database/Dataset Python

本文链接：https://blog.csdn.net/fengbingchun/article/details/78624358

版权

Python 同时被 2 个专栏收录

58 篇文章 12 订阅

订阅专栏

Database/Dataset

18 篇文章 4 订阅

订阅专栏

Banknote Dataset(钞票数据集)：这是从纸币鉴别过程中的图像里提取的数据，用来预测钞票的真伪的数据集。该数据集中含有1372个样本，每个样本由5个数值型变量构成，4个输入变量和1个输出变量。小波变换工具用于从图像中提取特征。这是一个二元分类问题。

每一行的5个(列)变量含义如下：

第一列：图像经小波变换后的方差(variance)(连续值)；

第二列：图像经小波变换后的偏态(skewness)(连续值)；

第三列：图像经小波变换后的峰度(curtosis)(连续值)；

第四列：图像的熵(entropy)(连续值)；

第五列：钞票所属的类别(整数，0或1)。

Banknote Dataset可以从 https://archive.ics.uci.edu/ml/datasets/banknote+authentication 下载，默认是txt格式，如下是数据集前10行的数据：

3.6216,8.6661,-2.8073,-0.44699,0
4.5459,8.1674,-2.4586,-1.4621,0
3.866,-2.6383,1.9242,0.10645,0
3.4566,9.5228,-4.0112,-3.5944,0
0.32924,-4.4552,4.5718,-0.9888,0
4.3684,9.6718,-3.9606,-3.1625,0
3.5912,3.0129,0.72888,0.56421,0
2.0922,-6.81,8.4636,-0.60216,0
3.2032,5.7588,-0.75345,-0.61251,0
1.5356,9.1772,-2.2718,-0.73535,0

以下是将txt转到csv格式的python代码：

import csv

txt_file = r"../../../data/database/BacknoteDataset/data_banknote_authentication.txt"
csv_file = r"../../../data/database/BacknoteDataset/data_banknote_authentication.csv"

in_txt = csv.reader(open(txt_file, "r"), delimiter = ',')
out_csv = csv.writer(open(csv_file, 'w', encoding = 'utf8'),  lineterminator = '\n')

out_csv.writerows(in_txt)

GitHub： https://github.com/fengbingchun/NN_Test