一个简单的子集产生算法

原创 2006年05月22日 01:08:00

  在做关联规则挖掘模块的时候,由频繁项集产生关联规则,需要使用到子集产生的算法。比如:
char[] A={'a','b','c','d',...},集合A中,产生所有A的子集{'a'},{'b'},{'a','b'},{'a','b','c'}...这些。

1. 我最初的实现方法

  在OpenMiner的关联模块实现之处,我考虑的方法和人们思考产生子集的方法类型,既是先产生所有的单个元素的子集,然后产生2个元素的子集,然后3个的,一直到n个元素的子集。这种方法符合人们思考的方向,不容易找漏掉,但是实现起来就比较困难了。

  /**
  * 开始产生所有子集(非空)
  *
  */
 public void beginGenerateSubItemSets() {
  m_SubItemSetIndexes = new int[m_ItemIndexes.length];
  m_SubItemSetIndexes[0] = 0;
  m_SubItemSetIndexCount = 1;
 }
 
 /**
  * 产生下一个子集(非空)
  * @return
  */
 public ItemIndexSet nextSubItemSet() {
  int i,k,j;
  int length = m_ItemIndexes.length;
  
  if(m_SubItemSetIndexCount > length)
   return null;
  
  ItemIndexSet subItemSet = new ItemIndexSet();
  subItemSet.m_ItemIndexes = new int[m_SubItemSetIndexCount];
  for(i=0;i<m_SubItemSetIndexCount; i++) {
   k = m_SubItemSetIndexes[i];
   subItemSet.m_ItemIndexes[i] = m_ItemIndexes[k];
  }
  
  j=0;
  m_SubItemSetIndexes[i-1]++;
  while(m_SubItemSetIndexes[i-j-1] >= length-j) {
   if(i-j-2 < 0) {
    m_SubItemSetIndexCount++;
    if(m_SubItemSetIndexCount <= length) {
     for(i=0;i<m_SubItemSetIndexCount; i++)
      m_SubItemSetIndexes[i] = i;
    }
    return subItemSet;
   }
   m_SubItemSetIndexes[i-j-2]++;
   j++;
  }
  if (j > 0) {
   k = m_SubItemSetIndexes[i - j - 1];
   i = i - j;
   while (i < length)
    m_SubItemSetIndexes[i++] = ++k;
  }
  
  return subItemSet;
 }
 
 /**
  * 结束产生子集(非空)的过程
  *
  */
 public void endGenerateSubItemSets() {
  m_SubItemSetIndexes = null;
 }

我整整用了一个整数和一个数组来保存当前产生所有集合的索引,甚至还实现了一个任意进制的加法算法。

2. 高手的实现方法

  最近从CSDN上看到了一个人的做法,很简单:

class Test
{
 static void Main(string[] args)
 {
  char[] chs = {'a','b','c','d'};
  SubSet s = new SubSet(chs);
  s.Print();
 }

}
class SubSet
{
 char[] chs;
 int bits = 0;
 public SubSet(char[] chs)
 {
  this.chs = chs;
 }

 public void Print()
 {
  for(int i = 0;i < (1<<chs.Length);i++)
  {
   for(int j = 0; j< chs.Length; j++)
    if( ((1 << j) & i) !=0 )
     Console.Write( chs[j] );
   Console.WriteLine();
  }
 }
}

 里面二进制位1,0,来产生对应的集合元素。比如一个整数的所有n个bits对应集合内的n个元素,1表示该子集内包含该元素,0表示不包含。则通过一个整数的累加,肯定会把n个bits的所有1,0排列组合情况产生完成。

  真是高明的做法!

 

 

求一个集合子集的算法示例

  • 2014年06月14日 21:26
  • 464KB
  • 下载

算法3:给一个字符数组(a-z),如何打印该数组成员构成集合的全部子集合

给一个字符数组(a-z),如何打印该数组成员构成集合的全部子集合样例字符数组ahia,输出如下: a h i ah ai hi ahi解题思路如下:1、首先算出字符数据中所包含的字符,使...
  • pplin
  • pplin
  • 2017年03月03日 13:32
  • 218

一个C语言子集cmm编译器的源代码

  • 2008年09月07日 16:54
  • 149KB
  • 下载

关于一个集合的子集的思考

之前做过很多类似的题目,比如说给你一个字符串ABC,然后请给出他的子集(A,B,C,AB,AC,BC,ABC),差不多都是这样的,当然也有给你ABC,请给出跟其长度一样的组合(ABC,ACB,BAC,...

实现一个集合中最大递增子集

  • 2014年05月06日 14:05
  • 2KB
  • 下载

输出一个集合的全部子集(C语言版)

将输入的任意a-z字符串中含有的元素组成集合,输出此集合的所有子集 题目来自July《面试和算法心得》第1章 字符串...

C/C++ 求一个集合的子集

  • 2012年04月02日 17:26
  • 538B
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:一个简单的子集产生算法
举报原因:
原因补充:

(最多只允许输入30个字)