KDD cup 1999数据随机抽样

最近在做KDD cup 1999的数据分析。其中有一条要求:

     将标签为normal的数据记为正例,随机选取其他标为入侵数据。
那如何随机抽取呢?

这里我用的是excel来实现随机抽取。

KDD99数据集有42列数据。也就是A-AP列。为了简单,不用整个的数据集,选取40条数据来完成这个小例子。

1  从AR列插入函数rand,AR1=RAND()。下拉到AR40,其实就是有多少数据就下拉多少。

2.在第一行选取42列,来存放一会随机抽取出来的数据。即AS-CH

3.在AS1中插入函数 =index($A$1:$AP$40,rank(ar1,ar:ar),0)

A1:AP40是指整个数据集的范围。

rank函数这一堆是行,后面的0是列。把列设置为0是选取所有的列。

4.往下拖动,需要抽取多少数据就往下拉多少。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值