自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

翻译 Spark简介

Spark是一个支持大数据计算的快速和广泛使用的框架此文为翻译spark官方文档,原文地址:https://spark.apache.org/Speed在内存上spark比hadoop mapreduce快100倍,在磁盘存储的情况下快10倍以上。Ease of use支持有java、scala、python、R编写spark应用程序,并且友好的这次此类程序的交互式编写。spark提供了超过80个的

2016-11-27 21:34:13 342

翻译 Pyspark官方文档

此文为翻译pyspark 2.0.2,主要介绍pyspark相关使用方法。原文链接问 —— [ Apache pyspark ]pyspark.sql module导入Spark SQL和DataFrames包:-pyspark.sql.SparkSession -pyspark.sql.DataFrame -pyspark.sql.Column -pyspark.sql.Row

2016-11-25 11:55:55 5803

翻译 Apache Toree工作原理

原文地址:https://toree.incubator.apache.org/documentation/user/how-it-works.html 此文为翻译Apache Toree的官方文档How it worksToree提供了一个与Spark集群交互式编程的界面。Torre的API支持多种语言和和执行程序。用户可通过交互式程序和Spark Context实现Spark任务。

2016-11-24 16:45:09 3032

原创 hive试题

1、代码select ceil(2.34)的结果是哪一个:A 2.3B 2C 3D 2.42、float表示的数据类型是:A 整数型B 字符性C 布尔型D 浮点型3、以下表达式书写错误的是A year('2015-12-31 12:21')B month(2015-10-31)C day('2015-12-11')D date_sub

2016-04-01 09:57:16 3793

原创 R系列之一 ----逻辑回归

require('data.table')path = 'D:/当前地址模型/addr_sample.txt'tb=fread(path,sep='\t',verbose = T,na.strings=c("NA","NULL",'NONE'),header = T,encoding='utf-8')col = sapply(tb, class)tb=fread(path,sep=

2016-03-18 19:57:25 614

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除