小范笔记

最新推荐文章于 2024-03-06 11:29:27 发布

我还是喜欢那辆AE86

最新推荐文章于 2024-03-06 11:29:27 发布

阅读量133

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45691275/article/details/104002806

版权

服务器集群
N个主机— 协作（虚拟机协作的主体） — 实现多主机协作的方式：hadoop 安装在所有的主机上的（前提需要安装jdk的）— 1master + n slave
大数据的服务器集群的搭建：
分布式服务器集群：多台主机 + linux + 1master+n slave
伪分布式服务器集群：在一台主机上模拟最终效果 hadoop
安装过程：jdk
hadoop：参数配置
多台主机==共同工作：如何分配谁干活、谁存储
mycat ：将动作（管理）进行分工
要对数据进行分工的 = 存储 + 管理
DBMS ：database manager system = 存储+管理
HBase：将数据（存储：存+备份）进行分工
大数据
大数据是如何管理数据的：BigData 侧重的是数据的分析
1、首先有数据：爬虫、需求方提供（大量的）–如何存储起来
存储基础的原始的数据(HBase分布式的数据库)
2、清洗数据（去除无效数据、对有效数据进行处理筛选）
更为精炼的、统一的数据
3、分析：数据分析、各种算法（不同语言处理算法方式不同）
计算后的结果性数据（需求）(Mysql+NoSql（mongoDB）)
4、可视化：JavaScript(ECharts百度写的；N3.js) R语言

如何实现存储的分工：
mysql+hive ：偏向于后期分析处理结果

列族：无法一次性定义到具体列、字段；将同类型分成一个列族
列族定义的时候，完全不清楚具体有什么子列的

我还是喜欢那辆AE86

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
小范笔记

服务器集群N个主机— 协作（虚拟机协作的主体） — 实现多主机协作的方式：hadoop 安装在所有的主机上的（前提需要安装jdk的）— 1master + n slave大数据的服务器集群的搭建：分布式服务器集群：多台主机 + linux + 1master+n slave伪分布式服务器集群：在一台主机上模拟最终效果 hadoop安装过程：jdkhadoop：参数配置多台主机==...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。