二元属性常常用1和0代表两种取值,此类属性对象的相似度可以用杰卡德距离计算。
定义:设对象X,Y中取值同为1的属性有p个,X 取1且取0的属性有q个,X 取0且Y 取1的属性有r个,则 X,Y 的杰卡德距离为d(X,Y)=(q+r)/ (p+q+r)。
例如考察两患者X,Y的症状情况(发烧、咳嗽、白细胞升高、呕吐、流鼻涕),如果他们取值分别是(1,1,0,0,1)和(1,0,0,1,0),取值为1表示有此症状,0表示无此症状,则他们的杰卡德距离为(2+1)/(1+2+1ÿ
二元属性常常用1和0代表两种取值,此类属性对象的相似度可以用杰卡德距离计算。
定义:设对象X,Y中取值同为1的属性有p个,X 取1且取0的属性有q个,X 取0且Y 取1的属性有r个,则 X,Y 的杰卡德距离为d(X,Y)=(q+r)/ (p+q+r)。
例如考察两患者X,Y的症状情况(发烧、咳嗽、白细胞升高、呕吐、流鼻涕),如果他们取值分别是(1,1,0,0,1)和(1,0,0,1,0),取值为1表示有此症状,0表示无此症状,则他们的杰卡德距离为(2+1)/(1+2+1ÿ