自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 数仓相关知识

什么是埋点?数据埋点分为初级、中级、高级三种方式,分别为:初级:在产品、服务转化关键点植入统计代码,据其独立ID确保数据采集不重复(如购买按钮点击率);中级:植入多段代码,追踪用户在平台每个界面上的系列行为,事件之间相互独立(如打开商品详情页——选择商品型号——加入购物车——下订单——购买完成);高级:联合公司工程、ETL采集分析用户全量行为,建立用户画像,还原用户行为模型,作为产品分析、优化的基础。数据埋点是一种良好的私有化部署数据采集方式。数据采集准确,满足了企业去粗取精,实现产品、

2020-10-20 22:47:12 110

原创 hive启动报错

呃,怎么说呢,打开hive-site.xml改了下uil然后就好了。。。。。

2020-05-17 22:51:32 243

原创 疯子learning日常

2020/5/17擦,zookeeper怎么都打不开,逼疯,花了三小时发现是防火墙忘关了,昨天也发生这样的事,浏览器打不开hdfscentos6关闭防火墙的两种方式:1.service iptables off :本次启动关闭2.chkconfig iptables off:永久关闭...

2020-05-17 19:18:16 104

原创 Hive 数据类型

基本数据类型Hive 的原子数据类型是可以进行隐式转换的,类似于 Java 的类型转换1. 隐式类型转换规则如下(1)任何整数类型都可以隐式地转换为一个范围更广的类型,如 TINYINT 可以转换成 INT, INT 可以转换成 BIGINT。(2)所有整数类型、 FLOAT 和 STRING 类型都可以隐式地转换成 DOUBLE。(3) TINYINT、 SMALLINT、 INT 都可以转换为 FLOAT。(4) BOOLEAN 类型不可以转换为任何其它的类型。2. 可以使用 CA..

2020-05-13 22:12:14 327

原创 Hive安装部署

1.Hive安装配置(1)把 apache-hive-1.2.1-bin.tar.gz 上传到 linux 的/opt/software 目录下(2)解压 apache-hive-1.2.1-bin.tar.gz 到/opt/module/目录下面(3)修改 apache-hive-1.2.1-bin.tar.gz 的名称为 hive(4)修改/opt/module/hive/conf 目录下的 hive-env.sh.template 名称为 hive-env.sh(5)配置 hive-env

2020-05-13 21:26:51 203

原创 Hive的一些基础概念

1.hive是什么:hive是Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,和提供和sql语法相似的查询功能;hive的本质是将HQL转化为MapReduce程序。 1) Hive 处理的数据存储在 HDFS2) Hive 分析数据底层的默认实现是 MapReduce3) 执行程序运行在 Yarn 上2.hive和数据库的比较(1)查询语言由于SQL被广泛的应用在数据仓库中,因此,专门针对...

2020-05-13 21:16:54 196

原创 Linux学习笔记-进程管理

相关概念1) 在LINUX中,每个执行的程序(代码)都称为一个进程,每一个进程都分配一个ID号。2) 每一个进程,都会对应一个父进程,而这个父进程可以复制多个子进程。例如www服务器3) 每个进程都可能以两种方式存在的。前台 与后台,所谓前台进程就是用户目前的屏幕上可以进行操作的。后台进程则是实际在操作,但由于屏幕上无法看到的进程,通常使用后台方式执行[sshd , crond]。4)...

2020-03-28 15:35:32 96

原创 Linux学习笔记-设置静态IP

1.vim /etc/sysconfig/network-scripts/ifcfg-eth02.service network restart3.reboot修改主机名

2020-03-28 15:15:31 56

原创 Linux学习笔记-组管理和权限管理

一般为文件的创建者,谁创建了该文件,就自然的成为该文件的所有者。chown 用户名 文件名 修改文件所有者chgrp 组名 文件名修改文件所在组r:read,可读w:write,可写x:execute,可执行...

2020-03-28 14:57:53 53

原创 Linux学习笔记-,常用指令

man [命令或配置文件](功能描述:获得帮助信息)help 命令 (功能描述:获得shell内置命令的帮助信息)pwd(功能描述:显示当前工作目录的绝对路径)ls [选项] [目录或是文件]-a :显示当前目录所有的文件和目录,包括隐藏的 (文件名以.开头就是隐藏)。-l:以列表的方式显示信息-h: 显示文件大...

2020-03-28 14:42:08 72

原创 Linux学习笔记-找回root密码

启动时->快速输入enter->输入e-> 进入到编辑界面-> 选择中间有kernel 项->输入e(edit)-> 在该行的最后写入 1 [表示修改内核,临时生效]-> 输入enter->输入b [boot]-> 进入到单用模式 【这里就可以做补救工作】...

2020-03-28 14:06:46 91

原创 Linux学习笔记-vi/vim快捷键

1) 拷贝当前行 yy , 拷贝当前行向下的5行 5yy,并粘贴 p。【快捷键在正常模式下使用】2) 删除当前行 dd , 删除当前行向下的5行 5dd3) 在文件中查找某个单词 [命令模式下(esc/:) /关键字 , 回车 查找 , 输入 n 就是查找下一个 ]4) 设置文件的行号,取消文件的行号.[命令行下 : set nu 和 :set nonu]5) 编辑...

2020-03-28 13:45:48 97

原创 Linux学习笔记-网络配置

1.Centos6网络配置的三种方式1.桥接模式:在桥接模式下,VMWare虚拟出来的操作系统就像是局域网中的一台独立的主机(主机和虚拟机处于对等地位),它可以访问网内任何一台机器。我们往往需要为虚拟主机配置IP地址、子网掩码等(注意虚拟主机的ip地址要和主机ip地址在同一网段)。这样,虚拟机就可以和主机之间独立的通信(当然,只要在同一个局域网中都可和虚拟机通信),同时,配置好网关和DNS的地...

2020-03-28 13:13:03 156

原创 ACID

数据库的ACID性质:原子性(ATOMIC) 整个事务中的所有操作,要么全部完成,要么全部不完成,不可能停滞在中间某个环节 一致性(Consistency)在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏 隔离性(Isolation)两个事务的执行是互不干扰的,一个事务不可能看到其他事务运行时中间某一时刻的数据 持久性(Durability)在事务完成以后,该事务所对数据库所作...

2019-12-22 15:59:47 154

原创 死锁

产生死锁的原因主要是:(1) 因为系统资源不足。(2) 进程运行推进的顺序不合适。(3) 资源分配不当等。如果系统资源充足,进程的资源请求都能够得到满足,死锁出现的可能性就很低,否则就会因争夺有限的资源而陷入死锁。其次,进程运行推进顺序与速度不同,也可能产生死锁。产生死锁的四个必要条件:(1)互斥条件:一个资源每次只能被一个进程使用。(2)请求与保持条件:一个进程因请求资源而阻...

2019-12-22 15:48:28 65

原创 刷题1221

有几种I/O控制方式?各有何特点?答:I/O控制方式有四种:程序直接控制方式、中断控制方式、DMA方式和通道控制方式。(1) 程序直接控制方式:优点是控制简单,不需要多少硬件支持。但CPU和外设只能串行工作,且CPU的大部分时间处于循环测试状态,使CPU的利用率大大降低,因此该方式只适用于那些CPU执行速度较慢且外设较少的系统。(2) 中断处理方式:优点是能实现CPU与外设间的并行操作...

2019-12-21 22:34:44 158

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除