自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 Git 常用命令

签名的作用是区分不同操作者身份。用户的签名信息在每一个版本的提交信息中能够看到,以此确认本次提交是谁做的。Git 首次安装必须设置一下用户签名,否则无法提交代码。:这里设置用户签名和将来登录 GitHub(或其他代码托管中心)的账号没有任。查看状态( 检测到工作区有文件被修改) )新增文件( (hello.txt )再次查看( 检测到未追踪的文件) )修改文件( (hello.txt )将暂存区的 文件 提交到本地库。将工作区的文件添加到暂存区。将修改的文件再次添加暂存区。

2023-08-02 10:53:17 87

原创 Git 安装

在 Git Bash 终端里输入 git --version 查看 git 版本,如图所示,说明 Git 安装成功。修改 Git 的环境变量,选第一个,不修改环境变量,只在 Git Bash 里使用 Git。选择 Git 终端类型,选择默认的 Git Bash 终端,然后继续下一步。默认分支名设置,选择让 Git 决定,分支名默认为 master,下一步。选择 Git 的凭据管理器,选择默认的跨平台的凭据管理器,然后下一步。选择 Git pull 合并的模式,选择默认,然后下一步。转换,然后继续下一步。

2023-08-02 10:51:28 37

原创 使用sqoop数据入仓

​​​​​useyyearsstringint参数设置:--1.设置动态分区--2.设置动态分区最大的分区数(默认100--3.设置非严格模式DW层int分区日期')useselectyears,name,substring(years。

2023-07-30 17:40:48 47 1

原创 Flume安装部署

Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。Flume支持定制各类数据发送方,用于收集各类型数据;同时,Flume支持定制各种数据接受方,用于最终存储数据。一般的采集需求,通过对flume的简单配置即可实现。针对特殊场景也具备良好的自定义扩展能力。因此,flume可以适用于大部分的日常数据采集场景。当前Flume有两个版本。Flume0.9X版本的统称Flume OG。

2023-07-30 17:34:52 118 1

原创 hive的远程模式安装配置

结束当前客户端进程,发现同级目录下会出现metastore_db目录以及derby.log,将其删除。此时无法直接使用hive命令启动客户端,因为metastore服务没有启动。不能实例化SessionHiveMetaStoreClient。换目录执行需要重新初始化元数据库,生成的库文件不可同步。执行脚本初始化derby数据库。元数据库问题推荐使用MySQL。推荐使用beeline客户端。执行成功后再次启动hive。换一个目录执行hive。

2023-07-30 17:29:24 75

原创 mysql 5.7 安装部署

MariaDB数据库管理系统是MySQL的一个分支,属于Centos7内置,主要由开源社区在维护,采用GPL授权许可。开发这个分支的原因之一是:甲骨文公司收购了MySQL后,有将MySQL闭源的潜在风险,因此社区采用分支的方式来避开这个风险。MariaDB的目的是完全兼容MySQL,包括API和命令行,使之能轻松成为MySQL的代替品。第一次使用必须设置复杂密码(由于 mysql 密码策略,此密码必须足够复杂)更改 mysql 密码策略最低限制,大于4位即可。启动mysql,设置开机启动。

2023-07-30 17:20:42 163 1

原创 Hadoop集群搭建

因为Hadoop是由java编写的,他的运行一定离不开jdk,又因为hadoop是分布式的需要多个节点去操作,这时一定要保证多个节点的时间同步,我们首先来配置jdk和时钟同步。Hadoop下载地址:https://archive.apache.org/dist/hadoop/common/hadoop-3.2.1/时间同步的方式:在集群中找一台机器,作为时间服务器,集群中其他机器与这台机器定时的同步时间,比如,每隔十分钟,同步一次时间。配置该offcn(superUser)允许通过代理的用户-->

2023-07-30 17:19:09 46 1

原创 sqoop安装

是Apache旗下的一款开源工具,该项目开始于2009年,最早是作为Hadoop的一个第三方模块存在,后来为了让使用者能够快速部署,也为了让开发人员能够更快速的迭代开发,并在2013年,独立成为Apache的一个顶级开源项目。功能完善、操作简便,同时支持多种访问模式(命令行操作、Web访问、Rest API),引入角色安全机制增加安全性等多种优点,但是结构复杂,配置部署更加繁琐。功能结构简单,部署方便,提供命令行操作方式,主要适用于系统服务管理人员进行简单的数据迁移操作;两个版本,其中,版本号为。

2023-07-30 17:15:11 34 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除