UCI数据集中文介绍:Waveform Database Generator (Version 1) Data Set

看论文用到了该数据集,没找到中文描述,且官网上描述非常简洁。所以查阅了原版书,将该数据集的介绍整理如下。

实验数据集:波形数据集(下载网址:UCI Machine Learning Repository: Waveform Database Generator (Version 1) Data Set)

样本数:5000,特征数量:21,用于分类,分为三类。

       该数据集收集的数据来自波形 中任意两种波形的随机凸组合。原始数据集用于分类问题,分为三个类别,每一类都由在添加了噪声的整数处采样的两种波形的随机凸组合组成。(波形图片在后文)

更具体地说,测量向量是21维的: 。要生成第1类向量 ,需要单独生成一个均匀随机数u和21个符合正态分布(均值为0,方差为1)的随机数 。然后设置:

要生成第2类向量,请重复上述操作并设置:

第3类向量由以下公式生成:

附上英文原版书页面,作者是为了讲清楚树状分类法举的这个例子。所以该数据集可以用于分类问题,我看的论文中是将它进行了预处理,做了离群点检测问题(跑了下代码感觉效果一般)。

 

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值