UCI数据集中文介绍:Waveform Database Generator (Version 1) Data Set

本文介绍了波形数据集,该数据集包含5000个样本,每个样本有21个特征,分为三类。数据集由两种波形的随机凸组合构成,适用于分类任务。文章还提及该数据集在离群点检测问题中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

看论文用到了该数据集,没找到中文描述,且官网上描述非常简洁。所以查阅了原版书,将该数据集的介绍整理如下。

实验数据集:波形数据集(下载网址:UCI Machine Learning Repository: Waveform Database Generator (Version 1) Data Set)

样本数:5000,特征数量:21,用于分类,分为三类。

       该数据集收集的数据来自波形 中任意两种波形的随机凸组合。原始数据集用于分类问题,分为三个类别,每一类都由在添加了噪声的整数处采样的两种波形的随机凸组合组成。(波形图片在后文)

更具体地说,测量向量是21维的: 。要生成第1类向量 ,需要单独生成一个均匀随机数u和21个符合正态分布(均值为0,方差为1)的随机数 。然后设置:

要生成第2类向量,请重复上述操作并设置:

第3类向量由以下公式生成:

附上英文原版书页面,作者是为了讲清楚树状分类法举的这个例子。所以该数据集可以用于分类问题,我看的论文中是将它进行了预处理,做了离群点检测问题(跑了下代码感觉效果一般)。

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值