java 随机 集合 子集_随机选择集合的子元素集合

我需要一个从集合N中随机选择M个子元素的算法。 当然最好的办法是将集合打乱顺序,然后从中选择前M个元素即可。 Java中现成的API可以使用:

java.util.Collections.shuffle(List>)

此算法非常简单,循环N次,每次长度减少1,随机获取其中一个元素,然后交换其对称元素。

public static void shuffle(List> list, Random rnd) {

int size = list.size();

if (size < SHUFFLE_THRESHOLD || list instanceof RandomAccess) {

for (int i=size; i>1; i--)

swap(list, i-1, rnd.nextInt(i));

} else {

Object arr[] = list.toArray();

// Shuffle array

for (int i=size; i>1; i--)

swap(arr, i-1, rnd.nextInt(i));

// Dump array back into list

ListIterator it = list.listIterator();

for (int i=0; i

it.next();

it.set(arr[i]);

}

}

}

有点意思的swap函数

public static void swap(List> list, int i, int j) {

final List l = list;

l.set(i, l.set(j, l.get(i)));

}

其实我们的需求很简单,在基本不变的集合中,多次重复随机获取其子集,至于子集是否有序或者随机不重要的, 重要的是原集合中的每个元素都有相似的概率出现在子集合中。

考虑到性能以及并发访问(多线程)的需要,我想到了一个简单的算法:

给定N个元素集合,从中选择M(0

(1) 随机选择索引K(0<=K

(2) 取有效元素N(k-i),N(k+i) 加入未满子集M

(3) i+=1, 重复(2) 直到子集M已满

(4) 终止

这样取出来的元素虽然和原始集顺序有一定的关系,但是每个元素在子集里出现的概率相当,满足结果要求。 最后生成的算法如下:

public static List randomList(List views, int max) {

final int size = views.size();

int index = RandomUtils.nextInt(size);

//

List ret = new ArrayList(max);

int low = index - 1, high = index;

while (max > 0 && (low >= 0 || high < size)) {

if (low >= 0 && max-- > 0) {

ret.add(views.get(low));

}

if (high < size && max-- > 0) {

ret.add(views.get(high));

}

low--;

high++;

}

return ret;

}

此算法满足如下特点:

足够快

线程安全(原始集合不变)

子元素出现概率相当(未经数学证明)

另外,stackoverflow上也有一些参考链接:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值