大数据

1.您对“大数据”一词有何了解?
答: 大数据是与复杂和大型数据集相关的术语。关系数据库无法处理大数据,这就是使用特殊工具和方法对大量数据执行操作的原因。大数据使公司能够更好地了解其业务,并帮助他们从定期收集的非结构化和原始数据中获取有意义的信息。大数据还允许公司采取数据支持的更好的业务决策。

2.大数据的五个V是什么?
答:大数据的五个V如下:
Volume -Volume表示体积大,即以高速率增长的数据量,即以PB为单位的数据量
Velocity -Velocity是数据增长的速度。社交媒体在数据增长速度方面发挥着重要作用。
Variety -Variety是指不同的数据类型,即各种数据格式,如文本,音频,视频等。
Veracity -Veracity是指可用数据的不确定性。由于大量数据带来不完整性和不一致性,因此产生了准确性。
Value -价值是指将数据转化为价值。通过将访问的大数据转换为价值,企业可以创造收入。
在这里插入图片描述
在这里插入图片描述
基于内容推荐算法:基于物品或内容的特征,发现物品之间的相似性,然后基于用户以前的喜好记录推荐给用户相似的物品。本质是对物品或内容进行分析建立特征,基于用户对什么特征的内容感兴趣以及分析一个物品具备什么特征来做推荐。不考虑用户之间的关系,只关注物品本身的特征,根据Item获得与之特征相似的Item进行推荐。简单来说就是根据用户之前喜欢的物品,通过对特征的匹配分析,预测用户的喜好。

基于用户的协同过滤推荐算法:寻找与目标用户有相同喜好的邻居,然后根据邻居的喜好向目标用户进行推荐。基本原理就是利用用户访问行为的相似性来推荐用户可能感兴趣的资源。根据用户-物品的评分矩阵,计算用户的相似度,根据相似用户的喜好进行推荐。主要关注User与Item之间的关联,与具体Item本身的特征没有关系,基于相似用户会喜欢相似物品的假设进行推荐。简单来说就是根据和某一用户有相似喜好的其他用户的喜好,从而预测该用户对物品的可能喜好。

差别在于:协同过滤必须要有用户行为,基于内容的推荐不考虑用户行为。冷启动阶段只能用基于内容的推荐,因为没有用户行为数据,积累一段时间用户行为数据后才可以使用协同过滤。

从用途上来说,协同过滤适合给用户带点新鲜感的使用场景,如“逛”淘宝的用户;而基于内容推荐更适合用户焦点比较集中的使用场景,如垂直领域的内容推送。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值