自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

chenjieit619的博客

11月 05月 04月 03月 02月 01月

原创 shell循环日期

1. touch test.sh2.[java] view plain copy #!/bin/sh startdate=`date -d "$1" +%Y-%m-%d` enddate=`date -d "$2" +%Y-%m-%d` while [[ $startdate do ec

2017-02-27 11:46:42 1380

转载 hive中order by,sort by, distribute by, cluster by作用以及用法

1. order by Hive中的order by跟传统的sql语言中的order by作用是一样的，会对查询的结果做一次全局排序，所以说，只有hive的sql中制定了order by所有的数据都会到同一个reducer进行处理（不管有多少map，也不管文件有多少的block只会启动一个reducer）。但是对于大量数据这将会消耗很长的时间去执行。这里跟传统的sql

2017-02-27 11:20:19 279

转载 Spark性能优化：数据倾斜调优

Spark性能优化：数据倾斜调优继《Spark性能优化：开发调优篇》和《Spark性能优化：资源调优篇》讲解了每个Spark开发人员都必须熟知的开发调优与资源调优之后，本文作为《Spark性能优化指南》的高级篇，将深入分析数据倾斜调优与shuffle调优，以解决更加棘手的性能问题。1.数据倾斜调优调优概述有的时候，我们可

2017-02-15 16:18:25 397

转载 Hbase 统计表行数的3种方式总结

有些时候需要我们去统计某一个Hbase表的行数，由于hbase本身不支持SQL语言，只能通过其他方式实现。可以通过一下几种方式实现hbase表的行数统计工作：1.count命令最直接的方式是在hbase shell中执行count的命令可以统计行数。[html] view plain copyhbase> co

2017-02-06 16:35:58 1472

文本分类语料库

Spark MLlib实现的中文文本分类–Naive Bayes。训练模型，语料非常重要，我这里使用的是搜狗提供的分类语料库，很早之前的了，这里只作为学习测试使用。

2016-10-25

搜狗实验室文本分类语料库

搜狗实验室文本分类语料库。可用于进行文本开发等相应实验练习

2016-10-25

redis设计与实现-(第二版)

熟悉redis原理，了解redis设计架构

2016-09-06

Scala编程(完整版)

学习scala编程利器！适合初学者。

2016-09-06

Scala编程(完整中文版)

2016-09-06

redis设计与实现(第二版)

2016-09-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

chenjieit619 CSDN认证博客专家 CSDN认证企业博客

码龄10年

IP 属地：广东省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

12: 原创

25万+: 周排名

100万+: 总排名

18万+: 访问

: 等级

1965: 积分

19: 粉丝

33: 获赞

11: 评论

87: 收藏

私信

关注

热门文章

分类专栏

系统安装 1篇
nexus 3篇
json||XML与java互转 3篇
sql 1篇
hbase 5篇
SecureCRT 1篇
jstorm 3篇
kafka 10篇
zookeeper 1篇
scala 10篇
flume 1篇
spring 2篇
linux 9篇
IDE 2篇
hadoop 4篇
css
R 4篇
spark 17篇
java 3篇
算法 1篇
hive 11篇
elasticsearch 1篇
Oracle 1篇

最新评论

jstorm部署《转》
CSDN-Ada助手: 非常感谢CSDN博主分享关于jstorm部署的经验，《转》这篇博客让我受益匪浅。我觉得下一篇博客可以写写jstorm的优化和调试技巧，这样的技术文章对其他用户也许会有很大的帮助。相信你的经验分享能够吸引更多的读者前来学习交流。加油！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
Linux查找占用的端口，并杀死进程
Tisfy: 看完之后，我激动的心情久久不能平复
spark submit参数调优
xyxyxyxyxyxyxxy: 写的挺好的，就是最后这个例子举得。。
spark submit参数调优
Yu_Chen__ 回复小羽Jary: 同问，--num-executors 100 这个集群大概多少台机器？
spark submit参数调优
依偎树旁回复小羽Jary: 同问，这样算下来一个任务消耗的内存和CPU得多大了

最新文章

提示

确定要删除当前文章？

取消删除