Hadoop 电影评分数据统计分析实验

该实验旨在通过Hadoop进行电影评分数据的统计分析,掌握Hive查询语句和R的可视化技巧。实验涉及Hive数据类型、查询语句的使用,以及R中的词云图和条形图绘制,用于展示电影评分和观看次数。
摘要由CSDN通过智能技术生成

Hadoop


Linux -> Hadoop -> HBase -> Spark

Hadoop分布式计算基础是什么?

1、存储

2、计算

电影评分数据统计分析实验

【项目目标】

1)掌握Hive的查询语句的使用
2)掌握R的可视化分析

【实验原理】

一、Hive支持多种不同长度的整型和浮点型数据类型,支持布尔类型,也支持无长度限制的字符串类型。
二、查询语句是所有数据库都包括的,并且很常用,所以需要熟练掌握。
三、R中的可视化非常漂亮,我们需要熟练使用。

【实验环境】

CentOS6.5、JDK1.7、Hadoop2.4.1、Hive0.12.0、R-3.2.2

【实验数据】

hot_movie

字段 定义
m_id (电影id)
score (系统评分)
m_name (电影名称)

user_movie

字段 定义
u_name (用户昵称)
m_id (电影id)
u_score (用户评分)

【实验步骤】

  • 6
    点赞
  • 85
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

喝着奶茶敲实验

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值