自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (5)
  • 收藏
  • 关注

原创 org.apache.hadoop.ipc.Client: Retrying connect to server

这个问题导致jps查看结点进程时发现找不到NodeManager或一段时间后消失,网上查找了很多博客,因hadoop版本不一样且出错的原因也可能不同,所以找了老半天。 步骤:jps --> 看logs中.log文件 --> 百度。 最后找到一个版本的博客提供的方法解决了我的问题:防火墙未关闭。http://itindex.net/detail/51063-hadoop 但是centos7版本

2016-02-15 13:00:50 1733 2

原创 spark调优

问题:后面的优化问题遇到了瓶颈。原因如下:    1.观察到/tmp的使用率一度达到98%,如果再在某一个一个语句中增加一个分隔符设置,还是会出现磁盘空间不足问题;     2.在增加分隔符之前,成功的把主要结果数据存储到内存中,使用了序列化与压缩,查看其大小为9.8GB,全部数据将是这个两倍左右。     3.partition分布不均匀时候,会造成shuffle时消耗大量磁盘空

2016-02-01 11:31:51 325

原创 spark实践——处理表

import org.apache.spark.HashPartitioner import org.apache.spark.mllib.linalg.distributed.{CoordinateMatrix, MatrixEntry} import org.apache.spark.rdd.RDD import org.apache.spark.sql.types._ import org.

2016-02-01 11:10:28 840

原创 问题记录

1.直接计算设备间的条件概率有一定道理,有另外的值得参考的数学方法:     1.1 计算均值与标准差        1.1.1  计算所有两设备间的概率之和,然后求取均值,然后计算标准差,根据环球科学上面的超过4倍标准差就比较罕见的说法(假设是正态分布?)判断哪些比较奇异;        1.1.2  求所有设备停电次数之和,求每个设备停电次数之和(所有时间、一小时内、一天内,以发现是突发

2016-02-01 10:40:13 350

learn_boot_view.rar

learn_boot_view.rar

2021-03-16

马尔科夫模型_paper

很好的隐马尔科夫教程,长达10页,欢迎下载

2015-02-20

知易Cocos2D-iPhone开发教程

很全的游戏开发,基于COCOS2D引擎,适合ANDROID和苹果

2012-12-01

UCI数据集大全,上学期间整理的

很全的UCI数据集,希望能帮到您,欢迎下载。上学期间整理的,用于做分类聚类等。欢迎您的下载与使用,时间很久了,谢谢网友的评论

2012-12-01

序列模式挖掘_paper

本文是基于GA,GP算法的改进而提出的GNP算法。

2012-10-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除