举个简单的例子来说明聚类序列拆分的过程:
首先给出以下序列集合: A { 8,3,5,5,8,5 }。
然后is_equal函数(在cvSeqPartition内,下面有详细说明)将A进行拆分聚类为 3个集合: B{ 5,5,5 } ,C{8,8}和D{3}。拆分原则是根据元素的多少来进行(3个5,2个8和1个3)。
最后cvSeqPartition函数的输出结果是各个数据在聚类集合中的位置索引值(从0开始),分别是: {1,2,0,0,1,0}。比如说:8是在第二个类中,索引值是1。
cvSeqPartition函数原型:
typedef int (CV_CDECL *CvCmpFunc)(const void *a, const void *b, const void *userdata);
int cvSeqPartition(const CvSeq* seq, CvMemStorage* storage, CvSeq** labels,CvCmpFunc is_equal, void* userdata);
参数解析:
-
seq:
- 划分序列 storage:
- 存储序列的等效类的存储器,如果为空, 函数用 seq->storage 存储输出标签。 labels:
- 输出参数。指向序列指针的指针,这个序列存储以0为开始的输入序列元素的标签。 is_equal:
- 比较函数指针。如果两个特殊元素是来自同一个类,那这个比较函数返回非零值,否则返回 0 。划分算法用比较函数的传递闭包得到等价类。 userdata:
- 直接传递给 is_equal 函数的指针。
函数 cvSeqPartition 执行二次方程算法为拆分集合为一个或者更多的等效类。 函数返回等效类的数目。
代码:
#include "cxcore.h"
#include "highgui.h"
#include <stdio.h>
CvSeq* point_seq = 0;
IplImage* canvas = 0;
CvScalar* colors = 0;
int pos = 10;
int is_equal( const void* _a, const void* _b, void* userdata )
{
CvPoint a = *(const CvPoint*)_a;
CvPoint b = *(const CvPoint*)_b;
double threshold = *(double*)userdata;
return (double)(a.x - b.x)*(a.x - b.x) + (double)(a.y - b.y)*(a.y - b.y) <= threshold;
}
void on_track( int pos )
{
CvSeq* labels = 0; //声明输出标签
double threshold = pos*pos; //定义阈值为pos^2
int i, class_count = cvSeqPartition( point_seq, 0, &labels, is_equal, &threshold );//拆分序列
//对point_seq点序列拆分为等效的类,条件是(Ax-Bx)^2+(Ay-By)^2<=pos^2
//含义为两点相差距离小于pos的属于一类
printf("%4d classes/n", class_count );
//打印出分了几类
cvZero( canvas );
for( i = 0; i < labels->total; i++ )
{//取点、取颜色,画圆,你可以用按任意键的方式一个点一个点的画
CvPoint pt = *(CvPoint*)cvGetSeqElem( point_seq, i );//取点
CvScalar color = colors[*(int*)cvGetSeqElem( labels, i )];
cvCircle( canvas, pt, 1, color, -1 );
cvShowImage( "points", canvas );
cvWaitKey(0);
}
}
int main( int argc, char** argv )
{
CvMemStorage* storage = cvCreateMemStorage(0);//建立了一个存储器
point_seq = cvCreateSeq( CV_32SC2, sizeof(CvSeq), sizeof(CvPoint), storage );
//建立了一个32位整型序列
CvRNG rng = cvRNG(0xffffffff);//初始化随机数生成器
int width = 500, height = 500;//定义图像的长和宽
int i, count = 1000;//定义了两个计数器
canvas = cvCreateImage( cvSize(width,height), 8, 3 );
//设置图像,大小为500*500,色深8,三通道
colors = (CvScalar*)cvAlloc( count*sizeof(colors[0]) );
//分配1000个CvScalar大小的内存缓冲区
for( i = 0; i < count; i++ )
{
CvPoint pt;//设置一个点
int icolor;//定义颜色标的
pt.x = cvRandInt( &rng ) % width;//随机产生点的x坐标
pt.y = cvRandInt( &rng ) % height;//随机产生点的y坐标
cvSeqPush( point_seq, &pt );//添加这个点到序列的尾部
icolor = cvRandInt( &rng ) +0xa0a0a0a0 ;
//用随机的方法给颜色标的一个基准,后边加的那个数字是可以任意的。
colors[i] = CV_RGB(icolor & 255, (icolor >> 8)&255, (icolor >> 16)&255);
//把这个点的颜色完全写入标量容器colors中
}
cvNamedWindow( "points", 1 );//创建窗口
cvCreateTrackbar( "threshold", "points", &pos, 50, on_track );
//建立拖动条,名称为threshold,窗口的名字叫points,创建初始化值取自pos,
//回调函数名称为on_track
on_track(pos);//监视拖动条的改变并处理之
cvWaitKey(0);
return 0;
}
结果如图:
窗口输出:
本实验是在500x500画布上由1000个点组成的序列在距离小于5时的划分。可以用聚类序列拆分cvSeqPartition来进行处理。比较函数为2个点之间的欧几里得,当2个点之间的距离小于等于100时返回1,否则返回0。聚类结果一参数labels中的值作为名字标出来。
(完)