自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(5)
  • 收藏
  • 关注

转载 本地连接访问gitHub

1.首先下载安装好本地git2.建一个文件夹,右击“git bash here”然后会出来git命令框;3.输入用户名、密码、邮箱:git config --global user.name “username”git config --global user.email “user@email”git config --global user.password “userpasswo...

2020-04-07 14:56:30 546

原创 mysql的编码问题

1.查看mysq字符集输入命令:show variables like ‘chara%’;2.找到mysql安装目录下的my-default.cnf文件,可以用( rpm -qal |grep mysql )命令。将文件复制一份到/etc目录下,并更名为my.cnf( cp /usr/share/mysql/my-default.cnf /etc/my.cnf )3.编辑my.cnf文...

2020-04-01 10:32:56 127

原创 Hive优化策略

1.Hadoop 框架计算特性1、数据量大不是问题,数据倾斜是个问题2、jobs 数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个 jobs,耗时很长。原因是 map reduce 作业初始化的时间是比较长的3、sum,count,max,min 等 UDAF,不怕数据倾斜问题,hadoop 在 map 端的汇总合并优化,使数据倾斜不成问题4、cou...

2019-09-16 18:39:01 136

转载 Hive 五种数据导入方式介绍

很详细

2019-09-12 10:24:35 101

原创 hive的开窗函数举例(SUM、AVG、MIN、MAX)

数据准备: cookie1,2015-04-10,1 cookie1,2015-04-11,5 cookie1,2015-04-12,7 cookie1,2015-04-13,3 cookie1,2015-04-14,2 cookie1,2015-04-15,4 cookie1,2015-04-16,4建表语句: create database if not exists my...

2019-09-12 10:13:39 3334

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除