数据挖掘
Catherine Lan
这个作者很懒,什么都没留下…
展开
-
GPS轨迹数据集免费下载资源整理(转载)
1. GeoLife GPS Trajectories该GPS轨迹数据集出自微软研究GeoLift项目。从2007年四月到2012年八月收集了182个用户的轨迹数据。这些数据包含了一系列以时间为序的点,每一个点包含经纬度、海拔等信息。包含了17621个轨迹,总距离120多万公里,总时间48000多小时。这些数据不仅仅记录了用户在家和在工作地点的位置轨迹,还记录了大范围的户外活动轨迹,比如...转载 2019-11-01 17:08:02 · 2806 阅读 · 0 评论 -
数据挖掘导论课后习题答案 第二章(一)
1.感觉中文翻译不是很用心,英语原文是the statistician says, “Yes, fields 2 and3 are basically the same.”意思是字段2和字段3基本一样,所以我们可以推测值可能是一样的,字段2除以字段3的值基本都是7,作者认为这两个字段包含了一样的信息,从如此小的样本得到结论是十分危险的。2.(a)二元、定性,序数(b)连续,定量,比率...翻译 2019-02-25 17:52:51 · 8210 阅读 · 2 评论 -
数据挖掘导论课后习题答案 第一章
1.需要抓住数据挖掘任务两大类任务以及四种主要数据挖掘任务的特点:预测任务、相关分析、聚类分析、异常检测。(a)并不是数据挖掘任务,只是简单的数据库查询工作。(b)设定一定阈值的会计计算,不是数据挖掘。如果是预测盈利就可以是数据挖掘(c)简单数值计算(d)数据库查询(e)由于骰子的出现的概率均等,这是概率计算问题,解决问题的方法已经由之前的数学家得出了(f)是的,预测任务...翻译 2019-02-25 15:26:59 · 3920 阅读 · 4 评论 -
数据挖掘导论课后习题答案 第二章(二)
19.余弦计算公式:相关计算公式:欧几里得公式:Jaccard 系数:(a) cov=0(b) cov=-1d(x,y)=2(c)\cov=0d(x,y)=2(d)cov=0.25J=0.6(e)cov=020.(a)[-1,1].很多时候数据正值比较多,因此只有[0,...翻译 2019-02-26 16:58:03 · 7338 阅读 · 0 评论