自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

工欲善其事,必先利其器

技术小白的笔记

  • 博客(4)
  • 资源 (2)
  • 收藏
  • 关注

原创 各省、自治区、直辖市分行业新三板上市公司数统计(不含香港、澳门、台湾)

各省、直辖市、自治区分行业新三板上市公司数统计(注: 统计用数据截至2018年2月23日)安徽北京福建甘肃广东广西贵州海南河北河南黑龙江湖北湖南吉林江苏江西辽宁内蒙古宁夏青海山东山西陕西上海四川天津西藏新疆云南浙江重庆...

2018-02-24 18:11:22 1605

原创 Spark 机器学习名词术语(持续更新)

1. 密集向量与稀疏向量对于向量(1.0, 2.0, 0.0, 3.0)有两种表示方法。密集向量表示法:密集向量的值就是一个普通的Double数组,向量(1.0, 2.0, 0.0, 3.0)用密集格式表示为[1.0, 2.0, 0.0, 3.0];稀疏向量表示法:稀疏向量由两个并列的数组indices和values组成,向量(1.0, 2.0, 0.0, 3.0)用稀疏格式表示为(4,[0,1,...

2018-02-22 15:43:19 231

原创 数据存储模式变换:给定任意正整数得到Excel的列头

最近公司给了一批数据,excel格式存储,列头是这样的(字段名简化):idc1_2014c1_2015c1_2016c1_2017c2_2014c2_2015c2_2016c2_2017......c52_2014c52_2015c52_2016c52_201701a11a12a13a14b11b12b13b14.....x11x12x13x1402a21a22a23a24b21b22b23b24...

2018-02-13 16:12:07 254

翻译 SPARK 2.2.1 不支持的hive的特性

下面是spark2.2.1目前不支持的hive的一些特性。这些特性大多数很少在hive部署中应用。1. hive的主要特性方面不支持表分桶操作:桶简单理解就是使用hash值对hive表进行分区。2. hive深奥特性方面不支持union数据类型(Hive 0.7.0开始才引入,但目前仍对此类型支持不够完全)。 以下是示例,帮助理解该数据类型,CREATE TABLE union_test(foo ...

2018-02-13 12:05:28 1182

winutils.exe(hadoop必备文件)

压缩文件包括以下版本的winutils.exe及hadoop.dll: hadoop-2.6.3;hadoop-2.6.4;hadoop-2.7.1;hadoop-2.8.1;hadoop-2.8.3;hadoop-3.0.0

2018-12-31

BI Kettle文档汇集.rar

kettle 使用说明及学习文档汇总; ETL工具Kettle用户手册;kettle常见问题FAQ;kettle技术手册;kettle接口抽取同步应用实例;开源ETL工具kettle系列之动态转换

2018-12-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除