山东大学软件学院2020-2021数据科学导论期末考试题

一、简答题

  1. 结合疫情分析说明大数据的全生命周期
  2. 举例说明关系型数据库的不足

二、设计题

  1. 设计mapreduce实现自然连接
  2. 新浪用redis存储用户信息,简述这样做的好处;○2新浪使用有序集合存储粉丝集合(数据规模可达亿),建立索引机制通过用户ID快速判断其是否在粉丝集合里

三、计算题

  1. TF-IDF的计算
  2. 加权的用户商品二分图,用随机算法推荐下一首音乐
音乐1音乐2音乐3音乐4音乐5音乐6音乐7
Alice541
Bob55442
John
xx

具体数据忘记了,大差不大。

建议选课时多听听学长学姐们的意见,莫使前人哀后人

  • 0
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值