自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

我和我追逐的梦~~~

向山顶爬去~~~

  • 博客(8)
  • 资源 (10)
  • 收藏
  • 关注

原创 Hadoop与HBase中遇到的问题(续)java.io.IOException: Non-increasing Bloom keys异常

在使用Bulkload向HBase导入数据中, 自己编写Map与使用KeyValueSortReducer生成HFile时, 出现了下面的异常: java.io.IOException: Non-increasing Bloom keys: 201301025200000000000003520000000000000500 after 20131119510000000000000001

2014-05-30 09:32:04 5272

转载 机器学习之开源库大总结

机器学习之开源库大总结  研究数据挖掘和机器学习有一段时间了,对数据挖掘来说,商用软件有SAS、Clementine、Oracle数据挖掘组件等等;由于个人学习和版权、算法定制等问题,开源的数据挖掘与机器学习软件(库)目前也十分必需,现在就跟大家介绍下比较流行和常用的机器学习开源库。  以前在学校用过matlab,说实话真方便,通常一个模型只要几十行甚至十几行代码就能搞定,但是正版

2014-05-26 15:41:20 1883

转载 Paxos在大型系统中常见的应用场景

来源: http://timyang.net/distributed/paxos-scenarios/在分布式算法领域,有个非常重要的算法叫Paxos, 它的重要性有多高呢,Google的Chubby [1]中提到all working protocols for asynchronous consensus we have so far encountered have

2014-05-13 19:28:27 4928

原创 在数组中寻找和为指定值的两个数

题目:在数组中寻找和为指定值的两个数,如arr={,

2014-05-11 19:50:18 3732

原创 在字符串中,寻找第一个只出现一次的字符

在字符串中,寻找第一个只出现一次的字符,如str=“abddgdbacdd", 结果是c三种方法:1. 使用字符字典数组,每个元素是一个结构体,第一个字段记录字符出现的次数,第二个字段记录该字符在字符串中第一次出现的位置,先遍历一遍字符串,对字符字典数组赋值,然后遍历一遍字符字典数组,找到第一个字段为1,且位置最小的字符即为需要寻找的字符。如下:struct node{ int

2014-05-11 17:29:09 1711

原创 Hadoop与HBase中遇到的问题

1. Hadoop中遇到的问题以前所遇到的问题由于没有记录,所以忘了 (1)NameNode没有启动成功, 是由于你对HDFS多次格式化,导致datanode中与namenode中的VERSION文件中的namespaceID不一致(对于NameNode节点,该文件位于hdfs-site配置文件中dfs.name.dir参数所指定的路径下的current文件夹中, 对于DataNode节点

2014-05-09 23:01:20 24970 6

原创 Hadoop配置文件与HBase配置文件

本Hadoop与HBase集群有1台NameNode, 7台DataNode1. /etc/hostname文件 NameNode:       node1DataNode 1:       node2DataNode 2:       node3.......DataNode 7:       node82. /etc/hosts文件N

2014-05-09 21:55:02 8258

原创 MapReduce生成HFile文件,再使用BulkLoad导入HBase中(完全分布式运行)

声明: 若要转载, 请标明出处.前提: 在对于大量的数据导入到HBase中, 如果一条一条进行插入, 则太耗时了, 所以可以先采用MapReduce生成HFile文件, 然后使用BulkLoad导入HBase中. 引用:一、这种方式有很多的优点:1. 如果我们一次性入库hbase巨量数据,处理速度慢不说,还特别占用Region资源, 一个比较高效便捷的方法就是使用 “Bulk

2014-05-09 21:16:16 27722 8

HTML5示例代码

适合于学习HTML5技术的新手和开发人员

2013-08-11

计算机系统结构量化研究方法第四版 答案

计算机 系统结构 量化研究方法 第四版 答案 清晰版

2012-11-21

斯坦福大学机器学习课件pdf格式清晰版

斯坦福大学机器学习课件pdf格式,清晰版,很好的课件

2012-11-19

Windows程序设计第五版

Windows程序设计第五版 对于学习C++,MFC,windows内核很有帮助,也是进行这些知识学习的必备基础

2011-11-11

计算机硬件知识

对于学习计算机的同学来说,是很好的入门资料,它对于学习各种计算机硬件很有帮助,帮你系统的认识计算机的各个部分,对于喜欢组装机器的同学来说很有帮助,对于要去购买计算机的人来说很有益~~~

2011-10-30

计算机图形学

这是我们学习计算机图形学的专业资料,对于学习计算机图形学的同学来说很有益,不过要求编程能力强,数学功底强作为基础。

2011-10-30

数据结构算法的实现(其中有flash播放)

数据结构算法的实现(其中有flash播放),对学习数据结构,学习常用算法以及对其进行实现很有帮助。包括各种排序算法(插入排序,快速排序,选择排序,归并排序,基数排序,计数排序,桶排序、冒泡排序,堆排序等等)、图论算法(最短路径,拓扑排序,关键路径,最小生成树,图的遍历等等)、各种链表、队列、树(二叉树,平衡二叉树,B书,红黑树,哈夫曼编码等等)、字符串操作、内存管理、外部排序、文件操作、哈希散列等等算法。对于每一位学计算机的都有极大帮助。

2011-10-30

程序设计实践(ACM)

一些ACM题目和答案,每个题目都有答案,而且答案运行有时间和空间的严格限制,对于提高编程能力很有帮助,也对参加ACM比赛很有帮助。包括哥德巴赫猜想,食物链,狼群战术,列车长的烦恼,最小生成树,凯撒密码,远古文明的算术,非前缀码,动态生成最小二叉排序树,小明数学题,成对字符串,唯一生成最小二叉树等问题

2011-10-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除