山东大学 数据科学导论 期末

一.简答
1.dirty data在哪些过程怎么产生
2.解释entity resolution
3.两个向量,计算距离(欧式,曼哈顿,汉明,切比雪夫,余弦)
二.好像也是简答???
1.mapreduce
(1)设计map和reduce方法实现表自然连接
(2)两个表的实例,根据表写mapreduce自然连接过程(课件上的order和item表)
2.词袋
(1)词袋的含义
(2)一组句子,用词袋向量表示
三.设计
1.personlrank,计算商品排序
2.一个表格,用户对音乐评分
(1)直观上a和哪个用户最相似
(2)利用数学模型计算a和哪个用户最相似

  • 1
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
山东大学数据科学导论是一门基础的数据科学课程,学生在学习过程中可能会面临很多挑战和难题。为了更好地备考和复习该课程,我推荐使用csdn(CSDN中文社区)作为复习资料。 首先,csdn是一个专门提供技术交流和资源分享的知识社区,拥有众多IT从业者、学生和爱好者参与其中,其中也包括了许多和数据科学相关的专家和研究者。在该平台上,你可以找到很多与山东大学数据科学导论课程相关的博文、教程和经验分享。这些资源可以帮助你更好地理解和掌握课程内容。 其次,csdn提供了一个开放的论坛环境,你可以在社区中与其他学生进行讨论和交流。这样一来,你不仅可以解决自己的疑惑,还可以通过与他人的交流分享自己的见解和学习心得。这种互动性有助于加深你对数据科学导论的理解和记忆。 此外,csdn还提供了一些实践项目和代码示例,可以帮助你将理论知识转化为实际应用能力。通过动手实践,你可以更深入地理解数据科学导论中的一些概念和方法,并提升自己的编程和数据处理技能。 总的来说,csdn是一个提供丰富、多样化的数据科学导论复习资料的平台。你可以在这里找到相关的学习资源、与他人交流和分享经验,并通过实践项目提升自己的实际应用能力。希望你能充分利用这个平台,取得好成绩!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值