2016年02月_zhhz418418

12月 11月 10月 08月 07月 06月 05月 04月 02月 01月

原创 org.apache.hadoop.ipc.Client: Retrying connect to server

这个问题导致jps查看结点进程时发现找不到NodeManager或一段时间后消失，网上查找了很多博客，因hadoop版本不一样且出错的原因也可能不同，所以找了老半天。步骤：jps --> 看logs中.log文件 --> 百度。最后找到一个版本的博客提供的方法解决了我的问题：防火墙未关闭。http://itindex.net/detail/51063-hadoop 但是centos7版本

2016-02-15 13:00:50 1733 2

原创 spark调优

问题：后面的优化问题遇到了瓶颈。原因如下： 1.观察到/tmp的使用率一度达到98%，如果再在某一个一个语句中增加一个分隔符设置，还是会出现磁盘空间不足问题； 2.在增加分隔符之前，成功的把主要结果数据存储到内存中，使用了序列化与压缩，查看其大小为9.8GB，全部数据将是这个两倍左右。 3.partition分布不均匀时候，会造成shuffle时消耗大量磁盘空

2016-02-01 11:31:51 325

import org.apache.spark.HashPartitioner import org.apache.spark.mllib.linalg.distributed.{CoordinateMatrix, MatrixEntry} import org.apache.spark.rdd.RDD import org.apache.spark.sql.types._ import org.

2016-02-01 11:10:28 840

原创问题记录

1.直接计算设备间的条件概率有一定道理，有另外的值得参考的数学方法： 1.1 计算均值与标准差 1.1.1 计算所有两设备间的概率之和，然后求取均值，然后计算标准差，根据环球科学上面的超过4倍标准差就比较罕见的说法（假设是正态分布？）判断哪些比较奇异； 1.1.2 求所有设备停电次数之和，求每个设备停电次数之和（所有时间、一小时内、一天内，以发现是突发

2016-02-01 10:40:13 350

learn_boot_view.rar

2021-03-16

马尔科夫模型_paper

很好的隐马尔科夫教程，长达10页，欢迎下载

2015-02-20

知易Cocos2D-iPhone开发教程

很全的游戏开发，基于COCOS2D引擎，适合ANDROID和苹果

2012-12-01

UCI数据集大全，上学期间整理的

很全的UCI数据集，希望能帮到您，欢迎下载。上学期间整理的，用于做分类聚类等。欢迎您的下载与使用，时间很久了，谢谢网友的评论

2012-12-01

序列模式挖掘_paper

本文是基于GA,GP算法的改进而提出的GNP算法。

2012-10-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

幸福安康！

原创 org.apache.hadoop.ipc.Client: Retrying connect to server

原创 spark调优

原创 spark实践——处理表

原创问题记录

learn_boot_view.rar

马尔科夫模型_paper

知易Cocos2D-iPhone开发教程

UCI数据集大全，上学期间整理的

序列模式挖掘_paper

空空如也

原创 org.apache.hadoop.ipc.Client: Retrying connect to server

原创 spark调优

原创 spark实践——处理表

原创 问题记录

learn_boot_view.rar

马尔科夫模型_paper

知易Cocos2D-iPhone开发教程

UCI数据集大全，上学期间整理的

序列模式挖掘_paper

空空如也

原创问题记录