1.大数据简介
1.1大数据理解误区:
大数据≠Hadoop≠大量的数据≠社交媒体数据≠技术≠一种解决方案
1.2解决方案包含:
数据,人,场景,应用,系统
1.3大数据的四个特点:
Variety(多)、Volume(快)、Velocity(杂)、Veracity(垃圾)
1.4数据资产评估维度:
颗粒度、活性、规模、关联度、多维
1.5大数据分布:
商业数据:2%
人为数据:8%
机器数据:90%
1.6过去与现在对比:
过去:随机样本,精确性,因果关系
今天: 全体数据,混沌性,相关关系
1.7现在的时代:
消费者主权时代
消费者自媒体时代
信息大爆炸时代
二.linux基础
1. 修改主机名:
将主机名(永久)修改为master
hostnamectl set-hostname master
查看自己主机名是否修改成功
Hostname
2. 设置静态ip
在你自己电脑的更改适配器设置里面
右键属性
虚拟机网络设置为仅主机模式
在网络设置里修改如下图所示
2. 将主机名与静态ip绑定
vi /etc/hosts
点击键盘i 进入编辑模式
加入你自己配置的静态ip+主机名
输入完成 esc ------ :------ wq!,保存
2. 关闭防火墙
禁止防火墙开机时启动 systemctl disable firewalld.service
3. ssh免密码登录
设备:
Master 192.168.99.77
Slave1 192.168.99.88
Slave2 192.168.99.99
1> 切换到根目录下 cd
2> 使用RSA算法生成秘钥 ssh-keygen -t rsa
测试: