自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

贾宝的博客

愿我的代码生涯少点bug吧...

  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

原创 安装python环境之Anaconda3

对于初学者来说,安装python环境的方式有两种,一种是安装原生的python,另一种就是今天我要介绍的安装Anaconda3。Anaconda相当于一个python的整合包,是一个开源的python发行版本,里面有各种科学包和依赖项,使用起来非常简单。下载官网地址:https://www.anaconda.com/download/国内镜像:https://mirrors.tuna....

2018-12-27 20:31:25 1888 2

原创 使用fastjson解析json字符串

在日常的工作中,json是一种非常常见的数据格式,它可以被理解为键值对存储的。由于最近分析业务的时候,又处理了两种json字符串,今天我就将怎么处理的给大家分享一下,希望能够给学习这方面的朋友一些帮助。再给大家安利个网站https://www.json.cn/,可以分析你得到的数据是否是json格式的。1.Json套Json我自己造了条数据,需求是取到内部json中的score。{"842"...

2018-12-19 21:29:07 32964 1

原创 Hive常用内部函数

1.取随机数rand()可以取到0-1之间的随机数,里面也可以随便设立一个种子,如rand(10),这时无论你输入多少次rand(10)都会到的一个稳定的0-1的随机数序列。2.分割字符串这个和java中的分割一样,是split,不过不同的是这里语法为split(str,分隔符),返回的也是一个array数组,同样可以通过数组下标来取值。3.字符串截取函数和java中substring用...

2018-12-19 20:48:46 280

原创 IDEA将依赖的第三方jar包打入jar包

昨天有人问我:使用Idea编译器,用自定义UDF在hive中清洗数据、处理数据,这时,使用的一些第三方jar包,在服务器上没有,打出来的udf的jar包也只有几k,不包含所依赖的jar包。所以运行时会报错,这时该怎么处理呢?在pom文件中添加如下代码,然后等待mvn加载完成,点击右边的maven projects,点击life cycle的package。或者在Terminal中输入mvn pa...

2018-12-18 19:47:07 7538 1

原创 sqoop导入hive遇到的错误

ERROR manager.SqlManager: Error reading from database: java.sql.SQLException: Streaming result set com.mysql.jdbc.RowDataDynamic@77e4c80f is still active. No statements may be issued when any streami...

2018-12-17 18:09:06 1587 1

原创 Idea怎么连接Gitee

对于程序员来说,github带来了极多的便利,而且提供了一个开源的环境供大家学习。现在开源中国旗下的码云也开始流行了起来,原因是因为它的操作和github类似,主要的是它是中文的,方便国人的使用。而Idea插件中就自带了github的连接,今天我要介绍的就是Idea怎么连接Gitee。没有配置的情况下,在Settings的Plugins中输入git,只出现GitHub和Git Integra...

2018-12-05 15:30:40 23821 3

原创 Linux装CentOS7最详细步骤

之前写了一篇关于安装CentOS6.5mini版的全步骤攻略。后来一想对于学习者来说,学使用CentOS7的更为重要,因为企业里用CentOS7的比6.5的要多,这次我就讲解一下安装CentOS7的全步骤。6.5的超链接=>CentOS6.5。前提一个CentOS7的DVD,以及VMware工具,电脑必须打开bios中的虚拟化(可以根据自己电脑配置在网上搜索)。步骤文件 =&g...

2018-12-02 21:50:51 3219

zookeeper-3.4.10

zookeeper是apache旗下,为大数据中分布式应用提供协调服务的一个软件。在Hadoop的HA中提供了避免单点故障,能够在一个节点宕机时,启动另一个节点,保证7x24高可用。而且HBASE也强依赖于zookeeper。

2018-11-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除