CDH 安装 记录

准备步骤如下:

第一步

首先准备三台机器,形成集群最少的台数。

例如ip地址为:192.2.1.1、192.2.1.2、192.2.1.3

192.2.1.1为master节点,其他作为节点

第二步

ssh免密登录 我认为最简单的方式是 在每个机器上执行 ssh key-gen -t rsa 之后,会在/root/.ssh的目录下生成 id_rsa.pub 和id_rsa 创建 authorized_keys 把几台机器的id_rsa.pub 全部 放进去 ,然后 开放权限 chmod +x authorized_keys.再把authorized_keys放在所有节点机器上面。

第三步

准备材料:

下载Cloudera Manager安装包 

地址:http://archive.cloudera.com/cm5/cm/5/

下载包样式:cloudera-manager-centos7-cm5.14.2_x86_64.tar

版本自己选择

下载CDH、一共三个东西需要在

下载地址:http://archive.cloudera.com/cdh5/  然后进入parcel

下载包样式:CDH-5.14.0-1.cdh5.14.0.p0.24-el7.parcel.sha1

CDH-5.8.0-1.cdh5.8.0.p0.42-el6.parcel

manifest.json

特别注意:而且需要注意的是CDH的版本需要等于或者小于Cloudera Manager的版本

第四步

安装jdk 这个教程自己百度,比较简单

第五步

关闭防火墙和SElinux 百度一下也比较简单

第六步

下载mysql 的驱动包

https://dev.mysql.com/downloads/connector/j/ 进入后选择platform independent下载 zip后缀包

然后解压 主要是后面需要里面的一个jar包

第七步

每个节点进行时间的同步

第八步

安装mysql,我用的是docker 没有在机器上安装。我是直接装到master机器上面的,你们如果有可以用的mysql也可以不用安装

如果要自己安装的话就百度一下。

注意安装好后就需要 创建 几个表 hive amon hue oozie
create database hive DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
create database amon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
create database oozie DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
create database hue DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

正式开始安装步骤如下:

提示:已下内容默认为在主机上面操作,除非提示其他节点时才是在其他节点操作。

第一步

解压下载的CM包,我是解压到  /opt路径下。建议解压到 空间大的路径下面。

第二步

修改 /opt/cm-5.8.2/etc/cloudera-scm-agent/config.ini中的server_host
为主节点的主机名。 (hostname)

第三步

解压刚刚下载的mysql zip把里面的jar包 复制到 /opt/cm-5.14.2/share/cmf/lib 路径下

第四步

主节点修改agent配置文件。

vim  /opt/cm-5.8.2/etc/cloudera-scm-agent/config.ini

修改其中的server_host=hadoop180主节点的主机名 我的master节点 主机名修改成了 hadoop180.

第五步

把主节点的cm-5.14.2 远程发到其它的子节点

执行以下命令:

scp -r cm-5.14.2 hadoop181:/opt  scp -r cm-5.14.2 hadoop182:/opt 

第六步

把CDH5需要的安装文件放到主节点上,新建目录为
/opt/cloudera/parcel-repo
把我们之前下载的三个文件放到这个目录下
CDH-5.8.0-1.cdh5.8.0.p0.42-el6.parcel
CDH-5.8.0-1.cdh5.8.0.p0.42-el6.parcel.sha1
manifest.json

需要注意的是
CDH-5.8.0-1.cdh5.8.0.p0.42-el6.parcel.sha1需要重命名成CDH-5.8.0-1.cdh5.8.0.p0.42-el6.parcel.sha

第七步

在主节点初始化CM5的数据库

执行命令

/opt/cm-5.14.2/share/cmf/schema/scm_prepare_database.sh mysql cm  -h hadoop180(master主机名)  -u  root  -p 123456(刚刚准备步骤中的MySQL密码和账号) --scm-host  hadoop180(master主机名) scm scm scm

参数说明
mysql:数据库用的是mysql,如果安装过程中用的oracle,那么该参数就应该改为oracle。
-hhadoop1:数据库建立在hadoop1主机上面。也就是主节点上面。
-uroot:root身份运行mysql。-123456:mysql的root密码是***。
--scm-host hadoop1:CMS的主机,一般是和mysql安装的主机是在同一个主机上。
最后三个参数是:数据库名,数据库用户名,数据库密码。
 

注意:

如果mysql是docker的话 需要在对应端口时用 --net=host
如果出现 权限问题,需要在mysql这个库名下面执行,重点是在名字为mysql这个数据库下面去执行


GRANT ALL PRIVILEGES ON *.* TO 'root'@'需要放开权限的服务器ip或者host名(必须在本地电脑也配置)' IDENTIFIED BY '123456' WITH GRANT OPTION;

FLUSH PRIVILEGES;

第八步

为保证不出现安装时报主机状况不良情况

需要删除 rm -f /opt/cm-5.14.2/lib/cloudera-scm-agent/cm_guid

第九步

启动 cm 和agent

/opt/cm-5.8.2/etc/init.d/cloudera-scm-server start 启动主节点
/opt/cm-5.8.2/etc/init.d/cloudera-scm-agent start 从节点
启动agent失败的时候 用 ps -ef | grep supervisord 杀掉整个进程

注意这儿要所有的agent服务都启动了才行。不然监测不到后面安装会出现异常 选不到主机

第十步

进入页面 登录 

ip:7180/cmf/login  admin  admin

第十一步

  1. 同意条款 点击继续
  2. 然后就是 主机选择 
  3. jdk跳过 不选,用自己的就行
  4. 选择使用 parcel安装 点击继续安装,这儿如果没有parcel的话需要 检查一下CDH的三个文件是否按照操作放到了规定的路径下面,一般可能是名称未修改或者文件名字错误了
  5. 安装出现 主机状况不良的话  rm -f /opt/cm-5.14.2/lib/cloudera-scm-agent/cm_guid 执行这个 然后重启 agent的每个节点
  6. 然后选择自己要安装的组件

参照 :https://blog.csdn.net/HFUTLXM/article/details/77605636?locationNum=1&fps=1#t2

深度学习是机器学习的一个子领域,它基于人工神经网络的研究,特别是利用多层次的神经网络来进行学习和模式识别。深度学习模型能够学习数据的高层次特征,这些特征对于图像和语音识别、自然语言处理、医学图像分析等应用至关重要。以下是深度学习的一些关键概念和组成部分: 1. **神经网络(Neural Networks)**:深度学习的基础是人工神经网络,它是由多个层组成的网络结构,包括输入层、隐藏层和输出层。每个层由多个神经元组成,神经元之间通过权重连接。 2. **前馈神经网络(Feedforward Neural Networks)**:这是最常见的神经网络类型,信息从输入层流向隐藏层,最终到达输出层。 3. **卷积神经网络(Convolutional Neural Networks, CNNs)**:这种网络特别适合处理具有网格结构的数据,如图像。它们使用卷积层来提取图像的特征。 4. **循环神经网络(Recurrent Neural Networks, RNNs)**:这种网络能够处理序列数据,如时间序列或自然语言,因为它们具有记忆功能,能够捕捉数据中的时间依赖性。 5. **长短期记忆网络(Long Short-Term Memory, LSTM)**:LSTM 是一种特殊的 RNN,它能够学习长期依赖关系,非常适合复杂的序列预测任务。 6. **生成对抗网络(Generative Adversarial Networks, GANs)**:由两个网络组成,一个生成器和一个判别器,它们相互竞争,生成器生成数据,判别器评估数据的真实性。 7. **深度学习框架**:如 TensorFlow、Keras、PyTorch 等,这些框架提供了构建、训练和部署深度学习模型的工具和库。 8. **激活函数(Activation Functions)**:如 ReLU、Sigmoid、Tanh 等,它们在神经网络中用于添加非线性,使得网络能够学习复杂的函数。 9. **损失函数(Loss Functions)**:用于评估模型的预测与真实值之间的差异,常见的损失函数包括均方误差(MSE)、交叉熵(Cross-Entropy)等。 10. **优化算法(Optimization Algorithms)**:如梯度下降(Gradient Descent)、随机梯度下降(SGD)、Adam 等,用于更新网络权重,以最小化损失函数。 11. **正则化(Regularization)**:技术如 Dropout、L1/L2 正则化等,用于防止模型过拟合。 12. **迁移学习(Transfer Learning)**:利用在一个任务上训练好的模型来提高另一个相关任务的性能。 深度学习在许多领域都取得了显著的成就,但它也面临着一些挑战,如对大量数据的依赖、模型的解释性差、计算资源消耗大等。研究人员正在不断探索新的方法来解决这些问题。
深度学习是机器学习的一个子领域,它基于人工神经网络的研究,特别是利用多层次的神经网络来进行学习和模式识别。深度学习模型能够学习数据的高层次特征,这些特征对于图像和语音识别、自然语言处理、医学图像分析等应用至关重要。以下是深度学习的一些关键概念和组成部分: 1. **神经网络(Neural Networks)**:深度学习的基础是人工神经网络,它是由多个层组成的网络结构,包括输入层、隐藏层和输出层。每个层由多个神经元组成,神经元之间通过权重连接。 2. **前馈神经网络(Feedforward Neural Networks)**:这是最常见的神经网络类型,信息从输入层流向隐藏层,最终到达输出层。 3. **卷积神经网络(Convolutional Neural Networks, CNNs)**:这种网络特别适合处理具有网格结构的数据,如图像。它们使用卷积层来提取图像的特征。 4. **循环神经网络(Recurrent Neural Networks, RNNs)**:这种网络能够处理序列数据,如时间序列或自然语言,因为它们具有记忆功能,能够捕捉数据中的时间依赖性。 5. **长短期记忆网络(Long Short-Term Memory, LSTM)**:LSTM 是一种特殊的 RNN,它能够学习长期依赖关系,非常适合复杂的序列预测任务。 6. **生成对抗网络(Generative Adversarial Networks, GANs)**:由两个网络组成,一个生成器和一个判别器,它们相互竞争,生成器生成数据,判别器评估数据的真实性。 7. **深度学习框架**:如 TensorFlow、Keras、PyTorch 等,这些框架提供了构建、训练和部署深度学习模型的工具和库。 8. **激活函数(Activation Functions)**:如 ReLU、Sigmoid、Tanh 等,它们在神经网络中用于添加非线性,使得网络能够学习复杂的函数。 9. **损失函数(Loss Functions)**:用于评估模型的预测与真实值之间的差异,常见的损失函数包括均方误差(MSE)、交叉熵(Cross-Entropy)等。 10. **优化算法(Optimization Algorithms)**:如梯度下降(Gradient Descent)、随机梯度下降(SGD)、Adam 等,用于更新网络权重,以最小化损失函数。 11. **正则化(Regularization)**:技术如 Dropout、L1/L2 正则化等,用于防止模型过拟合。 12. **迁移学习(Transfer Learning)**:利用在一个任务上训练好的模型来提高另一个相关任务的性能。 深度学习在许多领域都取得了显著的成就,但它也面临着一些挑战,如对大量数据的依赖、模型的解释性差、计算资源消耗大等。研究人员正在不断探索新的方法来解决这些问题。
【5层】公司办公楼全套设计+++(3156平,含计算书、建筑图,结构图、实习报告,PKPM,答辩PPT) 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博私信或留言,博看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博删除。 6、可私信博看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博私信或留言,博看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博删除。 6、可私信博看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博私信或留言,博看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博删除。 6、可私信博看论文后选择购买源代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值