matlab上确界距离,习题课PPT课件.ppt

最新推荐文章于 2024-05-13 09:01:39 发布

林展秋

最新推荐文章于 2024-05-13 09:01:39 发布

阅读量988

点赞数

文章标签： matlab上确界距离

《习题课PPT课件.ppt》由会员分享，可在线阅读，更多相关《习题课PPT课件.ppt(56页珍藏版)》请在金锄头文库上搜索。

1、智能信息处理习题答疑助教谭小勰邮箱 tanxx1214 习题 2 4 假设医院对18个随机挑选的成年人检查年龄和身体肥胖得到如下结果 a 计算age和 fat的均值中位数和标准差 b 绘制age和 fat的盒图 c 绘制基于这两个变量的散点图和q q图习题 2 4 a 计算age和 fat的均值中位数和标准差变量age的均值为46 44 中位数为51 标准差为12 85 变量 fat的均值为28 78 中位数为30 7 标准差为8 99 习题 2 4 b 绘制age和 fat的盒图 Matlab StatisticsToolbox 中的boxplot x 命令习题 2 4 c。

2、绘制基于这两个变量的散点图和q q图 Matlab StatisticsToolbox plot age fat o qqplot age fat 习题 2 8 假设我们有如下二维数据集 a 把该数据看做二维数据点给定一个新数据点x 1 4 1 6 作为查询点使用欧几里得距离曼哈顿距离上确界距离和余弦相似性基于与查询点的相似性对数据库的点排位 b 规格化该数据集使得每个数据点的范数等于1 在变换后的数据上使用欧几里得距离对诸数据点排位习题 2 8 a 把该数据看做二维数据点给定一个新数据点x 1 4 1 6 作为查询点使用欧几里得距离曼哈顿距离上确界距离和余弦相似性基。

3、于与查询点的相似性对数据库的点排位欧几里得距离曼哈顿距离上确界距离余弦相似性习题 2 8 a 把该数据看做二维数据点给定一个新数据点x 1 4 1 6 作为查询点使用欧几里得距离曼哈顿距离上确界距离和余弦相似性基于与查询点的相似性对数据库的点排位习题 2 8 a 把该数据看做二维数据点给定一个新数据点x 1 4 1 6 作为查询点使用欧几里得距离曼哈顿距离上确界距离和余弦相似性基于与查询点的相似性对数据库的点排位所以排序分别为欧几里得距离 x1 x4 x3 x5 x2曼哈顿距离 x1 x4 x3 x5 x2上确界距离 x1 x4 x3 x5 x2 x2 x。

4、6 x3 x4 余弦相似性 x1 x3 x4 x2 x5 习题 2 8 b 规格化该数据集使得每个数据点的范数等于1 在变换后的数据上使用欧几里得距离对诸数据点排位归一化后的数据习题 2 8 b 规格化该数据集使得每个数据点的范数等于1 在变换后的数据上使用欧几里得距离对诸数据点排位重新计算欧几里得距离排序为 x1 x3 x4 x2 x5 习题 3 3 在习题2 2中属性age包括以下值以递增序 13 15 16 16 19 20 20 21 22 22 25 25 25 25 30 33 33 35 35 35 35 36 40 45 46 52 70 a 使用深度为3的箱用。

5、箱均值光滑以上数据说明你的步骤讨论这种技术对给定数据的效果 b 如何确定该数据中的离群点 c 还有什么其他方法来光滑数据习题 3 3 在习题2 2中属性age包括以下值以递增序 13 15 16 16 19 20 20 21 22 22 25 25 25 25 30 33 33 35 35 35 35 36 40 45 46 52 70 a 使用深度为3的箱用箱均值光滑以上数据说明你的步骤讨论这种技术对给定数据的效果对以上数据进行箱深度为3的箱均值光滑需要一下步骤第一步对所有数据按从小到大排序也可以从大到小第二步将数据划分到大小为3的等频的箱中箱1 13 15 1。

6、6箱2 16 19 20箱3 20 21 22箱4 22 25 25箱5 25 25 30箱6 33 33 35箱7 35 35 35箱8 36 40 45箱9 46 52 70第三步计算每个箱的均值第四步将想汇总每一个值都替换为箱中的均值箱1 44 3 44 3 44 3箱2 55 3 55 3 55 3箱3 21 21 21箱4 24 24 24箱5 80 3 80 3 80 3箱6 101 3 101 3 101 3箱7 35 35 35箱8 121 3 121 3 121 3箱9 56 56 56 习题 3 3 在习题2 2中属性age包括以下值以递增序 13 15 16 16。

7、 19 20 20 21 22 22 25 25 25 25 30 33 33 35 35 35 35 36 40 45 46 52 70 b 如何确定该数据中的离群点聚类的方法可用来将相似的点分成组或簇并检测离群点落到簇的集外的值可以被视为离群点作为选择一种人机结合的检测可被采用而计算机用一种事先决定的数据分布来区分可能的离群点这些可能的离群点能被用人工轻松的检验而不必检查整个数据集 c 还有什么其他方法来光滑数据其它可用来数据光滑的方法包括别的分箱光滑方法如中位数光滑和箱边界光滑作为选择等宽箱可被用来执行任何分箱方式其中每个箱中的数据范围均是常量除了分箱方法外。

8、可以使用回归技术拟合成函数来光滑数据如通过线性或多线性回归分类技术也能被用来对概念分层这是通过将低级概念上卷到高级概念来光滑数据习题 3 7 使用喜帖3 3中给出的age数据回答一下问题 a 使用最小最大规范化将age值35变换到 0 0 1 0 区间 b 使用z分数规范化变换age值35 其中age的标准差为12 94岁 c 使用小数定标规范化变换age值35 d 之处对于给定的数据你愿意使用哪种方法陈述你的理由习题 3 7 使用喜帖3 3中给出的age数据回答一下问题 a 使用最小最大规范化将age值35变换到 0 0 1 0 区间 b 使用z分数规范化变换age值。

9、35 其中age的标准差为12 94岁 c 使用小数定标规范化变换age值35 d 之处对于给定的数据你愿意使用哪种方法陈述你的理由最小最大规范化 z分数规范化小数定标规范化习题 3 7 使用喜帖3 3中给出的age数据回答一下问题 a 使用最小最大规范化将age值35变换到 0 0 1 0 区间 b 使用z分数规范化变换age值35 其中age的标准差为12 94岁 c 使用小数定标规范化变换age值35 d 之处对于给定的数据你愿意使用哪种方法陈述你的理由最小最大规范化习题 3 7 使用喜帖3 3中给出的age数据回答一下问题 a 使用最小最大规范化将age值。

10、35变换到 0 0 1 0 区间 b 使用z分数规范化变换age值35 其中age的标准差为12 94岁 c 使用小数定标规范化变换age值35 d 之处对于给定的数据你愿意使用哪种方法陈述你的理由 z分数规范化习题 3 7 使用喜帖3 3中给出的age数据回答一下问题 a 使用最小最大规范化将age值35变换到 0 0 1 0 区间 b 使用z分数规范化变换age值35 其中age的标准差为12 94岁 c 使用小数定标规范化变换age值35 d 之处对于给定的数据你愿意使用哪种方法陈述你的理由小数定标规范化由于最大的绝对值为70 所以j 2则习题 3 7 使用喜帖3 3。

11、中给出的age数据回答一下问题 a 使用最小最大规范化将age值35变换到 0 0 1 0 区间 b 使用z分数规范化变换age值35 其中age的标准差为12 94岁 c 使用小数定标规范化变换age值35 d 之处对于给定的数据你愿意使用哪种方法陈述你的理由 d 小数定标规范化保持数据的分布和直观解释同时针对该题还可以挖掘特殊的age数据组最小最大规范化当出现除遇到出界失误以外的一个落在最大值和最小值以外的点值时会出现意外结果 Z分数规范化 Z分数规范化将数值转化成表示与平均值的距离的度量基于标准差没有小数定标规范化直观习题 3 12 a 简略描述ChiMerg。

12、e如何工作 b 取鸢尾花数据集作为待离散化的数据集合使用ChiMerge方法对四个数值属性分别进行离散化分裂点最终区间习题 3 12 a 简略描述ChiMerge如何工作 b 取鸢尾花数据集作为待离散化的数据集合使用ChiMerge方法对四个数值属性分别进行离散化分裂点最终区间 a 伪代码开始将数据按升序排列为每一个不同的数值分配一个单独的间隔当没有达到终止条件时开始计算每对相邻间隔的开方值用最小的开方值合并这两个区间结束结束习题 3 12 b 取鸢尾花数据集作为待离散化的数据集合使用ChiMerge方法对四个数值属性分别进行离散化分裂点最终区间习题 6 6 。

13、数据库有5个事务设min sup 60 min conf 80 a 分别使用Apriori算法和FP growth算法找出频繁项集比较两种挖掘过程的有效性 b 列举所有与下面的原规则匹配的强关联规则给出支持度s和置信度c 其中 X是代表顾客的变量如 A B 等习题 6 6 数据库有5个事务设min sup 60 min conf 80 a 分别使用Apriori算法和FP growth算法找出频繁项集比较两种挖掘过程的有效性 Apriori算法由于只有5个购买事件所以绝对支持度是5 min sup 3 第一步扫描所有事物对每个候选计数生成C1 习题 6 6 绝对支持度是。

14、3 第一步扫描所有事物对每个候选计数生成C1 C1 习题 6 6 绝对支持度是3 第二步通过候选的支持度计数与最小支持度技术比较确定L1 L1 C1 习题 6 6 绝对支持度是3 第三步连接和剪枝由L1产生候选C2 L1 C2 习题 6 6 绝对支持度是3 第四步通过候选的支持度计数与最小支持度技术比较确定L2 C2 L2 习题 6 6 绝对支持度是3 第五步连接和剪枝由L2产生候选C3 C3 L2 习题 6 6 绝对支持度是3 第六步通过候选的支持度计数与最小支持度技术比较确定L3 L3 C3 习题 6 6 绝对支持度是3 第七步连接和剪枝由L3产生候选C4 因。

15、为C4 因此算法终止 C4 L3 终止习题 6 6 Apriori算法找出的所有频繁项集 L3 L2 L1 习题 6 6 数据库有5个事务设min sup 60 min conf 80 a 分别使用Apriori算法和FP growth算法找出频繁项集比较两种挖掘过程的有效性 FP growth算法数据库的都成扫描与Apriori算法相同得到L1 再按支持度计数的递减序排序得到L K 5 E 4 M 3 O 3 Y 3 N 2 D 1 扫描每个事物按以上L的排序从根节点开始得到FP 树习题 6 6 FP growth算法数据库的都成扫描与Apriori算法相同得到L1 。

16、再按支持度计数的递减序排序得到L K 5 E 4 M 3 O 3 Y 3 扫描每个事物按以上L的排序从根节点开始得到FP 树习题 6 6 FP growth算法习题 6 6 数据库有5个事务设min sup 60 min conf 80 a 分别使用Apriori算法和FP growth算法找出频繁项集比较两种挖掘过程的有效性效率比较 Apriori算法的计算过程必须对数据库作多次扫描而FP 增长算法在构造过程中只需扫描一次数据库再加上初始时为确定支持度递减排序的一次扫描共计只需两次扫描由于在Apriori算法中的自身连接过程产生候选项集候选项集产生的计算代价非常高而FP 增长算法不需产生任何候选项习题 6 6 数据库有5个事务设min sup 60 min conf 80 b 列举所有与下面的原规则匹配的强关联规则给出支持度s和置信度c 其中 X是代表顾客的变量如 A B 等习题 6 8 数据库有4个事务设min sup 60 min conf 80 a 在item category粒度例如 itemi可以是 Milk 对于下面的规则模板。

林展秋

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
matlab上确界距离,习题课PPT课件.ppt

《习题课PPT课件.ppt》由会员分享，可在线阅读，更多相关《习题课PPT课件.ppt(56页珍藏版)》请在金锄头文库上搜索。1、智能信息处理习题答疑助教谭小勰邮箱 tanxx1214 习题 2 4 假设医院对18个随机挑选的成年人检查年龄和身体肥胖得到如下结果 a 计算age和 fat的均值中位数和标准差 b 绘制age和 fat的盒图 c 绘制基于这两个变量的散点图和q q图习题 ...
复制链接

扫一扫