自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (1)
  • 收藏
  • 关注

原创 java 自定义 hive udf 函数 并注册使用

java 自定义 hive udf 函数 并注册使用1.继承UDF类,实现 evaluate()1.1 导入依赖pom.xml 依赖<dependency> <groupId>org.apache.hive</groupId> <artifactId>hive-exec</artifact...

2019-07-19 17:18:28 670

原创 hive,mysql,sqlserver 列转行函数,一行转成多行;行转列函数,多行合并成一行

一、列转行1.hive 列转行实现方式原始数据:create table test(name string,subject string) row format delimited fields terminated by ‘\t’ escaped by ‘\’ stored as textfile;insert into test(name,subject)values(‘name...

2019-04-01 17:17:19 1365

原创 windows 上搭建pyspark环境,并使用pyspark连接hive

windows 上搭建pyspark环境,并使用pyspark连接hive由于最近有使用python连接hive,编写spark程序的需求,所以开始搭建pyspark的windows开发环境开发环境:pycharm2018 + python3.6 + spark2.3 + pyspark2.3 + hadoop2.61.安装jdk1.8以上版本1.下载并安装jdk1.8,记住安装路径下载...

2019-03-07 16:36:03 3746

python机器学习基础教程(图灵)

Python机器学习基础教程 图灵程序设计丛书 第 1 章介绍机器学习的基本概念及其应用,并给出本书会用到的基本设置。 • 第 2 章和第 3 章介绍实践中最常用的机器学习算法,并讨论这些算法的优缺点。 • 第 4 章介绍在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面 第 5 章介绍模型评估和调参的高级方法,重点讲解交叉验证和网格搜索。 • 第 6 章解释管道的概念。管道用于串联多个模型并封装工作流。 • 第 7 章介绍如何将前面各章讲述的方法应用到文本数据上,还介绍了一些文本特有的处理方法

2018-12-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除