数据挖掘导论课后习题答案 第二章(二)

本文介绍了数据挖掘中余弦计算公式、欧几里得距离和Jaccard系数的概念。通过举例解释了不同情况下cov、d(x,y)、J的值,阐述了余弦度量与欧几里得距离的关系,以及它们如何反映数据的相似性。对于初学者,理解这些基本概念和应用更为关键。" 106867163,4862841,Android TabLayout+ViewPager+Fragment 实战指南,"['Android开发', '高级UI', 'Material Design', 'viewpager', 'tablayout']
摘要由CSDN通过智能技术生成

19.余弦计算公式:

相关计算公式:

欧几里得公式:

Jaccard 系数:

(a)

     cov=0

(b)

  cov=-1

d(x,y)=2

(c)

\

cov=0

d(x,y)=2

(d)

cov=0.25

J=0.6

(e)

cov=0

20.

(a)[-1,1].很多时候数据正值比较多,因此只有[0,1]

(b) 两个对象相似,但是对象的值不一定相等,比如向量x=(1,1,1,1),y=(2,2,2,2)

(c)如果两个向量有平均值0,cov(x,y)=cos(x,y)

(d)因为所有的100,000个点能够落入曲线上,所以欧几里得距离和余弦度量存在函数关系。具体来说,欧几里得距离和余弦度量存在相反关系。举例说明,如果两个点是一样的,他们的余弦度量是相似的,他们的欧几里得距离是0,但是如果两个数据有很高的欧几里得距离,它们的余弦度量就接近于0,请注意,所有示例数据点 来自正象限,即只有正值。这个意味着所有的余弦值都是正的。

(e)因为所有的100,000个点能够落入曲线上,所以欧几里得距离和相关性存在函数关系。具体来说,欧几里得距离和相关性存在相反关系。举例说明,如果两个点是一样的,他们的相关性是相似的,他们的欧几里得距离是0,但是如果两个数据有很高的欧几里得距离,它们的相关就接近于0,请注意,所有示例数据点 来自正象限,即只有正值。这个意味着所有的相关值都是正的。

(f)

(g)

21题以后的题目偏定理证明题目,对于初学者来说先熟悉概念和应用比较重要。所以有空再翻译啦

  • 8
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值