自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (10)
  • 收藏
  • 关注

原创 shell循环日期

1. touch test.sh2.[java] view plain copy #!/bin/sh  startdate=`date -d "$1" +%Y-%m-%d`  enddate=`date -d "$2" +%Y-%m-%d`    while [[ $startdate do      ec

2017-02-27 11:46:42 1380

转载 hive中order by,sort by, distribute by, cluster by作用以及用法

1. order by    Hive中的order by跟传统的sql语言中的order by作用是一样的,会对查询的结果做一次全局排序,所以说,只有hive的sql中制定了order by所有的数据都会到同一个reducer进行处理(不管有多少map,也不管文件有多少的block只会启动一个reducer)。但是对于大量数据这将会消耗很长的时间去执行。    这里跟传统的sql

2017-02-27 11:20:19 279

转载 Spark性能优化:数据倾斜调优

Spark性能优化:数据倾斜调优   继《Spark性能优化:开发调优篇》和《Spark性能优化:资源调优篇》讲解了每个Spark开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark性能优化指南》的高级篇,将深入分析数据倾斜调优与shuffle调优,以解决更加棘手的性能问题。1.数据倾斜调优调优概述      有的时候,我们可

2017-02-15 16:18:25 397

转载 Hbase 统计表行数的3种方式总结

有些时候需要我们去统计某一个Hbase表的行数,由于hbase本身不支持SQL语言,只能通过其他方式实现。可以通过一下几种方式实现hbase表的行数统计工作:1.count命令最直接的方式是在hbase shell中执行count的命令可以统计行数。[html] view plain copyhbase> co

2017-02-06 16:35:58 1472

文本分类语料库

Spark MLlib实现的中文文本分类–Naive Bayes。训练模型,语料非常重要,我这里使用的是搜狗提供的分类语料库,很早之前的了,这里只作为学习测试使用。

2016-10-25

搜狗实验室 文本分类语料库

搜狗实验室 文本分类语料库。可用于进行文本开发等相应实验练习

2016-10-25

redis设计与实现-(第二版)

熟悉redis原理,了解redis设计架构

2016-09-06

Scala编程(完整版)

学习scala编程利器!适合初学者。

2016-09-06

Scala编程(完整中文版)

2016-09-06

redis设计与实现(第二版)

2016-09-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除