大数据库
文章平均质量分 79
随兴随缘
算法领域优质创作者
展开
-
大数据题目集——选择题
1:IBM提出的大数据的5V特点包括: ( ) 、高速、低价值密度、真实性。大量、多样2:大数据是由结构化数据、半结构化数据和 ( )数据组成的。非结构化3:Hadoop是一个数据管理系统,作为( ) 的核心,汇集了结构化和非结构化的数据。数据分析4:Hadoop是一个大规模( ),拥有超级计算能力。并行处理框架5:( )是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在( )中的大规模数据的机制。Hive, Hadoop6:Hive数据仓库工具能将结构化原创 2022-12-06 22:33:44 · 1911 阅读 · 0 评论 -
大数据库题目集——判断题
1:根据IDC作出的估测,数据每两年增长一倍。T2:根据IDC作出的估测,数据一直都在以每年50%的速度增长。T3:大数据是一种价值密度低,而商业价值高的数据集合。T4:大数据是由结构化、半结构化数据和非结构化数据组成的。T5:大数据是由结构化、半结构化数据和非结构化数据组成的。F6:大数据是一种价值密度低,商业价值也低的数据集合。F7:大数据是一种价值密度低,商业价值也低的数据集合。F8:Hadoop汇集了结构化和非结构化的数据。T9:Hadoop是一个大规模串行处理框架,拥有超级计算能力。F10:CAP原创 2022-12-06 20:29:51 · 2818 阅读 · 0 评论 -
军用大数据 - Spark机器学习
三种坦克图片数据集,如下图所示:以上有三种数据集,分别是以bmp-2开头的BMP-2步兵战车的图片、以btr-70开头的BTR-70装甲输送车的图片、以t-72开头的T-72主战坦克的图片。原创 2022-10-22 14:10:01 · 3681 阅读 · 2 评论 -
Hive的安装与配置
Hive的安装与配置由于Hive是一个基于Hadoop分布式文件系统的数据仓库架构,主要运行在 Hadoop分布式环境下,因此,需要在文件hive-env.sh中指定Hadoop相关配置文件的路径,用于Hive访问HDFS(读取fs.defaultFS属性值)和 MapReduce(读取mapreduce.jobhistory.address属性值)等Hadoop 相关组件。至此Hive配置完成。在/opt/hive/conf目录下,修改hive-site.xml和hive-env.sh两个文件。原创 2022-10-18 18:52:54 · 4436 阅读 · 3 评论 -
旅游网站之数据分析
3:在Reduce节点执行类中,统计以城市ID为维度的酒店价格均价,并保存到Hbase;需要满足ROWKEY为城市ID、列族为average_infos、表字段名称为price,计算出的价格均价为表字段值。2:在Reduce节点执行类中,统计以评论中分词后的词组为维度的词频数量,并保存到Hbase。2:在Map节点执行类中把城市ID当成的输出key,酒店价格当成Mapper类的输出value;1:在Map节点执行类中把评论进行分词当成输出key,Mapper类的输出value为固定值1。原创 2022-10-16 11:18:28 · 3073 阅读 · 4 评论 -
Redis命令实践
【代码】Redis命令实践。第1关:字符串、列表与集合第1:使用Redis管理登录令牌第2关:使用Redis实现购物车第3关:使用Redis做页面缓存第4关:使用Redis做数据缓存原创 2022-10-06 17:49:51 · 1360 阅读 · 0 评论 -
大数据库练习题
1:根据IDC作出的估测,数据每两年增长一倍。T2:根据IDC作出的估测,数据一直都在以每年50%的速度增长。T3:大数据是一种价值密度低,而商业价值高的数据集合。T4:大数据是由结构化、半结构化数据和非结构化数据组成的。T·5:大数据是一种价值密度高,商业价值也高的数据集合。F6:大数据是一种价值密度低,商业价值也低的数据集合。F7:大数据是一种价值密度高,而商业价值低的数据集合。F8:Hadoop汇集了结构化和非结构化的数据。T9:Hadoop是一个大规模串行处理框架,拥有超级计算能力。F。...原创 2022-08-25 20:14:14 · 852 阅读 · 0 评论