目录:
- 什么是大数据
- 大数据应用场景
- 岗位说明
- 如何学习大数据
- 虚拟机的概念与安装
- linux操作系统
- centos7的安装
- xshell连接linux
一.什么是大数据
是指大小超出传统数据库软件工具,抓取、储存、管理和分析能力的数据群,大数据一般在10TB左右,多用户将多个数据集成在一起,形成PB级的数据量,同时。这些数据来自多个数据源,并以实时、迭代的方式来实现大量化、多样式、快速化、价值化(4v)是大数据主要特征。
1.大数据项目、系统和大数据平台的区别
2.集群与分布式
3.大数据平台介绍:
4.开发与分析的区别
二.大数据应用场景
云化IDC说明:
三.职位说明
![](https://img-blog.csdnimg.cn/20190117002934856.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3lpZ3VhbmdfODIw,size_16,color_FFFFFF,t_70)
四.如何学习大数据
- 主操作系统改为linux。
- 大数据开发与分析是两门学科,重心掌握工具的配置与使用。
- 分布式、集群在大数据里面很重要,但学习过程中我们更重要是掌握技术的使用。
- 课后练习一定要相应的操作笔记。
- 每天、每周都要学会总结。
五.虚拟机的概念和安装
1.介绍
2.下载VMare,并安装
详细步骤:https://blog.csdn.net/qq_42570879/article/details/82853708
安装注意:
注意:vmware 新建虚拟机后 不显示:应该是vmware被windows系统防火墙拦截了。解决方法:控制面板-->windows防火墙-->关闭windows防火墙。
六.linux操作系统
Linux特点
- 源码的开放化
Linux操作系统是免费的,并且开发人员可以自由获取使用Linux源代码,开发者可以针对不同的应用需求对源码进行修改和优化,极大的便捷了嵌入式系统的开发,这也是其他操作系统无法做到的。 - 支持多用户及任务并行
Linux系统可支持多名用户在线使用,每个用户之间互不影响,有较好的保密性;Linux可同时执行多个程序,并且各个程序的运行是独立的。 - 良好的安全性及稳定性
Linux的内核继承了Unix系统的稳定、高效的特性,这一特性已在各领域得到了大量的验证。同时Linux采取了如对读、写控制、审计跟踪、核心授权等多种安全技术,保障用户开发环境的安全。 - 广泛的硬件平台支持
Linux可以在多种硬件平台上进行运行,如在带有x86、680x0、SPARC、Alpha等大多数主流的处理器平台均可以运行。 - 移植的便捷性
Linux系统是一个可移植的操作系统,它的内核设计非常精巧,可依据嵌入式的需求,实时的将某些模块从内核插入或移除。而Linux移植也就十分便捷,从一个平台转移到另一个平台后仍能保持自身的正常运行。
七.CentOS7.2的安装
步骤:https://blog.csdn.net/qq_42570879/article/details/82853708Centos7下载和安装详细教程
- 下载CentOS7,无需解压
注意:本人下载是mini版,其他步骤相同 - 开启VMare,开启虚拟机,安装linux(就是centOS7)
- 下载Xshell,并安装
Xshell的作用:如果复制本地文本,粘贴到linux中会出现出题,因为此粘贴命令无法识别,所以用Xshell来连通本地机和虚拟机 - 将虚拟机和本地机连通进行配置
大概配置流程: - Centos7安装需要注意的几个地方
然后点击应用。