- 博客(5)
- 收藏
- 关注
转载 本地连接访问gitHub
1.首先下载安装好本地git2.建一个文件夹,右击“git bash here”然后会出来git命令框;3.输入用户名、密码、邮箱:git config --global user.name “username”git config --global user.email “user@email”git config --global user.password “userpasswo...
2020-04-07 14:56:30 563
原创 mysql的编码问题
1.查看mysq字符集输入命令:show variables like ‘chara%’;2.找到mysql安装目录下的my-default.cnf文件,可以用( rpm -qal |grep mysql )命令。将文件复制一份到/etc目录下,并更名为my.cnf( cp /usr/share/mysql/my-default.cnf /etc/my.cnf )3.编辑my.cnf文...
2020-04-01 10:32:56 140
原创 Hive优化策略
1.Hadoop 框架计算特性1、数据量大不是问题,数据倾斜是个问题2、jobs 数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个 jobs,耗时很长。原因是 map reduce 作业初始化的时间是比较长的3、sum,count,max,min 等 UDAF,不怕数据倾斜问题,hadoop 在 map 端的汇总合并优化,使数据倾斜不成问题4、cou...
2019-09-16 18:39:01 146
原创 hive的开窗函数举例(SUM、AVG、MIN、MAX)
数据准备: cookie1,2015-04-10,1 cookie1,2015-04-11,5 cookie1,2015-04-12,7 cookie1,2015-04-13,3 cookie1,2015-04-14,2 cookie1,2015-04-15,4 cookie1,2015-04-16,4建表语句: create database if not exists my...
2019-09-12 10:13:39 3374
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人