大数据学习笔记(二)——Linux系统的安装和使用

第二章 Linux系统的安装和使用

2.1 Linux系统简介

Linux是一套免费使用和自由传播的类UNIX操作系统,是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。

Linux的发行版本可以大体分为两类:

①商业公司维护的发行版本:以著名的Redhat为代表;

②社区组织维护的发行版本:以Debian为代表,Debian 是社区类Linux的典范,是迄今为止最遵循GNU规范的Linux系统。Ubuntu 严格来说不能算一个独立的发行版本,Ubuntu是基于Debian的unstable版本加强而来的。Ubuntu就是一个拥有Debian所有的优点以及自己所加强的优点的近乎完美的Linux桌面系统,在服务端和桌面端使用占比最高,网络上资料最齐全。

2.2 Linux系统安装

Linux系统主要有两种安装方式:虚拟机安装方式和双系统安装方式,建议使用双系统安装方式,在网上找一靠谱安装教程即可。

2.3 Linux系统及相关软件的基本使用方法

2.3.1 Shell

Shell是Linux系统的用户界面,提供了用户与Linux系统内核进行交互操作的一种接口,它接收用户输人的命令并把它送入内核去执行。当人们在Linux系统中打开一个终端(可以采用快捷键Ctrl + Alt + T)时,就进入了Shell 命令提示符状态,在里面输入的用户命令,都会被送入Linux内核去执行。每个Linux系统的用户可以拥有自己的Shell,用以满足他们自己专门的Shell需要。Shell有多种不同的版本,主要有下列版本的Shell:

①Bourne Shell::由贝尔实验室开发;

②BASH:是GNU的Bourne Again Shell,是GNU操作系统上默认的Shell;

③Korn Shell:是对Bourne Shell的发展,在大部分内容上与Bourne Shell兼容;

④C Shell:是SUN公司Shell的BSD版本;

⑤Z Shell:Z是最后一个字母,也就是终极Shell,集成了BASH、ksh的重要特性,同时又增加了自己独有的特性。

2.3.2 root用户

对于Linux系统而言,超级用户一般命名为root,相当于Windows系统中的Administrator用户。root 是系统中唯一的超级用户,具有系统中所有的权限,如启动或停止一个进程、删除或增加用户、增加或者禁用硬件等。Linux 中的root用户比Windows的Administrator用户的能力更大,足以把整个系统的大部分文件删掉,导致系统完全毁坏,不能再次使用。所以,用root进行不当的操作是相当危险的,轻微的可以造成死机,严重的甚至不能开机。因此,在实际使用中,除非确实需要,一般情况下都不推荐使用root用户登录Linux系统进行日常的操作。建议单独建立一个普通的用户,来学习大数据软件安装和开展编程实践。

2.3.3 创建普通用户

请参照:Linux系统创建普通用户

2.3.4 sudo命令

sudo是Linux系统的管理指令,管理员可以授权给一些普通用户去执行一些需要root权限执行的操作。这样不仅减少了root 用户的登录和管理时间,同样也提高了安全性。使用hadoop用户登录Linux系统以后,当需要执行只有root用户有权限执行的命令时,都要在命令前面加上sudo,才能够顺利执行,如果不加上sudo,就会被拒绝执行。当使用sudo命令时,会要求输入当前用户的密码。需要注意的是,Windows系统中,用户输入密码,都会在屏幕上显示作为反馈,但是,在Linux系统中,当输人密码时,不会在屏幕上显示作为反馈,这时,不要误以为系统死机或者键盘出了问题,只要输完密码后按Enter键即可。

2.3.5 常用的Linux系统命令

在这里插入图片描述

2.3.6 文件解压缩

大数据软件安装包通常都是一个压缩文件,文件名以.tar.gz为后缀(或者简写为.tgz),这种压缩文件必须经过解压缩以后才能够安装。在Linux系统中,可以使用tar命令对后缀名为.tar.gz(或.tgz)的压缩文件进行解压:

tar -zxf /home/hadoop/Downloads/hbase-1.1.2-bin.tar.gz -C /usr/local

该命令表示把”/home/hadoop/Downloads/hbase-1.1.2-bin.tar.gz“这个文件解压缩后保存到/usr/local目录下,其中,各个参数的含义如下:

①x:从tar包中把文件提取出来;

②z:表示tar包是被gzip压缩过的,所以解压时需要用gunzip解压;

③f:表示后面跟着的是文件;

④C:表示文件解压后转到指定的目录下。

2.3.7 常用的目录

Linux系统的根目录/下,有两个重要的子目录:

①/home目录:/home 目录包含了各个用户的用户目录,每当在Linux系统中新建一个普通用户时,系统就会自动为这个用户创建用户主目录(主文件夹),例如,创建hadoop用户时,就会自动创建用户主目录/home/hadoop及其下面的各个子目录。假设当前采用hadoop用户登录了Linux系统,这时执行下面命令后,就会进入到hadoop用户的主文件夹即/home/hadoop目录:

cd ~

②/usr目录:/usr目录是UNIX Software Resource的简写,表示这里是各种软件安装的目录。对于/usr目录而言,只需要关注它下面的子目录/usr/local,一般由用户安装的软件都建议安装到该目录下。

2.3.8 目录的权限

Linux系统对文件权限有着严格的规定,如果一个用户不具备权限,将无法访问目录及其下面的文件。例如,使用hadoop用户登录Linux系统以后,从网络上下载了HBase安装包文件,把文件解压缩到/usr/local/目录下,会得到一个类似/usr/local/hbase这样的目录,这时,hadoop用户并不是/usr/local/hbase这个目录的所有者,无法对该目录进行相关操作,从而无法正常使用HBase。这时,就必须采用chown命令进行授权,让hadoop用户拥有对该目录的权限,具体命令如下:

sudo chown -R hadoop /usr/local/hbase

2.3.9 更新APT

APT是一款非常优秀的软件管理工具,Linux系统采用APT来安装和管理各种软件。安装成功Linux系统以后,需要及时更新APT软件,否则,后续一些软件可能无法正常安装。登录Linux系统,打开一个终端,进入Shell 命令提示符状态,然后输人下面命令:

sudo apt-get update

该命令执行以后,Linux系统就会开始从网络上下载APT的各种更新。若出现“Hash 校验和不符”的提示,则可通过更改软件源来解决。若没有该问题,则不需要更改。另外,从软件源下载某些软件的过程中,可能由于网络方面的原因出现没法下载的情况,那么建议更改软件源。不过,需要说明的是,在后续安装各种大数据软件过程中,即使出现“Hash 校验和不符”的提示,一般也不会影响Hadoop等软件的正常安装。

2.3.10 切换中英文输入法

Ubuntu中终端输人的命令一般都是使用英文输人。但是,有时候也会需要输人中文。Linux系统的中英文输人法的切换方式是使用Shift键来切换,或者,也可以单击系统桌面顶部菜单的输人法按钮进行切换。Ubuntu自带的Sunpinyin中文输人法已经可以很好满足中文输人要求,不需要额外安装中文输人法。

2.3.11 vim编辑器的使用方法

vim编辑器是Linux系统上最著名的文本/代码编辑器,是vi编辑器的加强版,可以帮助人们完成文件的创建和代码的编写。登录Linux系统,打开一个终端,然后执行下列命令完成vim编辑器的安装:

sudo apt-get install vim

下面演示一个实例来了解vim编辑器的使用方法。假设要在/home/hadoop/目录下新建一个文件word.txt,里面包含一些单词。可以执行下面命令创建一个word. txt文件:

cd ~
vim word.txt

通过上面命令就打开了vim编辑器,然后,需要键盘敲击输人一个英文字母i,进人编辑状态以后才能修改内容,这时,就可以向word. txt文件中输入一些单词。修改后,需要按键盘上的Esc键退出vim的编辑状态,之后有以下几种选择:

①从键盘输人“:wq"3个英文字符,然后按Enter键,表示保存文件并退出;

②从键盘输人“:q”两个英文字符,然后按Enter键,表示不保存并退出。如果本次编辑过程只是查看了文件内容,没有对文件做任何修改,则可以顺利退出。但是,如果已经修改了文件内容,则vim编辑器不允许就这样退出,会给出提示信息,这时,要想不保存就退出vim编辑器,就要采用下面一种方式,即输人“:q!”;

③从键盘输人“:q!"3个英文字符,然后按Enter键,表示不保存并强制退出。

我们从键盘输人“:wq"3个英文字符,然后按Enter 键,表示保存文件并退出vim编辑器。这样,就成功创建了word. txt文件,这时使用Is命令查看,就会发现/homc/hadoop/目录下多了一个word. txt文件。

如果要查看word. txt文件中的内容,可以采用两种方式:

①使用vim编辑器打开word. txt文件,查看其内容;

②使用cat命令,这种方式要比前一种简单得多。

这里需要指出的是,在Linux系统中使用vim编辑器创建一个文件时,并不是以扩展名来区分文件的,不管是否有扩展名,都是生成文本文件,txt扩展名只是我们自己人为添加,方便自己查看用的。也就是说,创建word. txt和word这两个文件,对于Linux系统而言都是默认创建了文本类型的文件,和是否有txt扩展名没有关系。

2.3.12 在Windows系统中使用SSH方式登录Linux系统

采用虚拟机安装方式时可以用到。

2.3.13 在Linux系统中安装Eclipse

在Eclipse官网中下载Eclipse,安装到Linux即可,请参照:Linux系统安装Eclipse
安装Eclipse完成后,如果想把Eclipse添加到applications列表,使它加入快捷界面,请参照:Linux系统将Eclipse加入快捷界面

2.3.14 其他使用技巧

①使用Tab键自动补全命令;

②隐藏文件:在Linux下,以英文点号“.”开头命名的文件,在系统中被视为隐藏文件。因此,如果想隐藏某个文件或目录,一种简单的办法就是把文件名命名为以英文点号开头。例如.bashrc文件,就是一个隐藏文件,用来保存系统的各种环境变量;

③重现历史命令:在Linux的终端中,人们会输如大量命令,系统会自动保存人们历史上输入的命令,可以按键盘上的“上箭头”和“下箭头”按钮,翻看历史命令,找到某条历史命令后,可以直接按Enter键执行该命令,这样,就不需要重复输入一些较长的命令了,大幅节省了命令输入时间。

2.4 学习资源

参考书本:《大数据技术原理与应用概念、存储、处理、分析与应用》第二版,《大数据基础编程、实验和案例教程》

厦门大学大数据课程公共服务平台:http://dblab.xmu.edu.cn/post/bigdata-teaching-platform/

《大数据技术原理与应用概念、存储、处理、分析与应用》第二版教材官网:http://dblab.xmu.edu.cn/post/bigdata/

《大数据基础编程、实验和案例教程》教材官网:http://dblab.xmu.edu.cn/post/bigdatapractice/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
cda备考学习学习笔记——基础知识篇()主要涉及了计算机科学与技术领域的基本概念和知识。 首先,它介绍了计算机网络的基础知识。网络是将多台计算机通过通信链路连接起来,使它们能够相互通信和共享资源的系统笔记中详细介绍了网络的组成、拓扑结构和通信协议等重要内容。 其次,笔记还解释了计算机系统的基本组成。计算机系统由硬件和软件两部分组成,其中硬件包括中央处理器、存储器、输入输出设备等,而软件则分为系统软件和应用软件。笔记详细介绍了各种硬件和软件的功能和作用。 此外,笔记还对数据库管理系统进行了介绍。数据库管理系统是一种用于管理和组织数据的软件系统,它能够实现数据的存储、检索和更新等操作。笔记中详细介绍了数据库的概念、结构和操作等内容。 最后,笔记还包括了算法和数据结构的基础知识。算法是解决问题的一系列步骤和规则,而数据结构则是组织和存储数据的方式。笔记中介绍了常用的算法和数据结构,如排序算法、树和图等。 总之,通过学习CDA备考学习笔记中的基础知识篇(),我们能够更好地理解计算机网络、计算机系统、数据库管理系统以及算法和数据结构等相关概念和知识。这些基础知识对于我们深入研究计算机科学与技术领域是非常重要的,也为我们日后的学习和工作奠定了坚实的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值