2014年05月_一只鸟的天空

09月 08月 05月 04月 01月

原创 Hadoop与HBase中遇到的问题(续)java.io.IOException: Non-increasing Bloom keys异常

在使用Bulkload向HBase导入数据中, 自己编写Map与使用KeyValueSortReducer生成HFile时, 出现了下面的异常: java.io.IOException: Non-increasing Bloom keys: 201301025200000000000003520000000000000500 after 20131119510000000000000001

2014-05-30 09:32:04 5272

转载机器学习之开源库大总结

机器学习之开源库大总结　　研究数据挖掘和机器学习有一段时间了，对数据挖掘来说，商用软件有SAS、Clementine、Oracle数据挖掘组件等等；由于个人学习和版权、算法定制等问题，开源的数据挖掘与机器学习软件(库)目前也十分必需，现在就跟大家介绍下比较流行和常用的机器学习开源库。　　以前在学校用过matlab，说实话真方便，通常一个模型只要几十行甚至十几行代码就能搞定，但是正版

2014-05-26 15:41:20 1883

转载 Paxos在大型系统中常见的应用场景

来源: http://timyang.net/distributed/paxos-scenarios/在分布式算法领域，有个非常重要的算法叫Paxos, 它的重要性有多高呢，Google的Chubby [1]中提到all working protocols for asynchronous consensus we have so far encountered have

2014-05-13 19:28:27 4928

原创在数组中寻找和为指定值的两个数

题目：在数组中寻找和为指定值的两个数，如arr={，

2014-05-11 19:50:18 3732

原创在字符串中，寻找第一个只出现一次的字符

在字符串中，寻找第一个只出现一次的字符，如str=“abddgdbacdd", 结果是c三种方法：1. 使用字符字典数组，每个元素是一个结构体，第一个字段记录字符出现的次数，第二个字段记录该字符在字符串中第一次出现的位置，先遍历一遍字符串，对字符字典数组赋值，然后遍历一遍字符字典数组，找到第一个字段为1，且位置最小的字符即为需要寻找的字符。如下：struct node{ int

2014-05-11 17:29:09 1711

原创 Hadoop与HBase中遇到的问题

1. Hadoop中遇到的问题以前所遇到的问题由于没有记录,所以忘了 (1)NameNode没有启动成功, 是由于你对HDFS多次格式化,导致datanode中与namenode中的VERSION文件中的namespaceID不一致(对于NameNode节点,该文件位于hdfs-site配置文件中dfs.name.dir参数所指定的路径下的current文件夹中, 对于DataNode节点

2014-05-09 23:01:20 24970 6

原创 Hadoop配置文件与HBase配置文件

本Hadoop与HBase集群有1台NameNode, 7台DataNode1. /etc/hostname文件 NameNode: node1DataNode 1: node2DataNode 2: node3.......DataNode 7: node82. /etc/hosts文件N

2014-05-09 21:55:02 8258

原创 MapReduce生成HFile文件,再使用BulkLoad导入HBase中(完全分布式运行)

声明: 若要转载, 请标明出处.前提: 在对于大量的数据导入到HBase中, 如果一条一条进行插入, 则太耗时了, 所以可以先采用MapReduce生成HFile文件, 然后使用BulkLoad导入HBase中. 引用:一、这种方式有很多的优点：1. 如果我们一次性入库hbase巨量数据，处理速度慢不说，还特别占用Region资源，一个比较高效便捷的方法就是使用 “Bulk

2014-05-09 21:16:16 27722 8

Windows程序设计第五版

Windows程序设计第五版对于学习C++，MFC，windows内核很有帮助，也是进行这些知识学习的必备基础

2011-11-11

计算机硬件知识

对于学习计算机的同学来说，是很好的入门资料，它对于学习各种计算机硬件很有帮助，帮你系统的认识计算机的各个部分，对于喜欢组装机器的同学来说很有帮助，对于要去购买计算机的人来说很有益~~~

2011-10-30

计算机图形学

这是我们学习计算机图形学的专业资料，对于学习计算机图形学的同学来说很有益，不过要求编程能力强，数学功底强作为基础。

2011-10-30

数据结构算法的实现（其中有flash播放），对学习数据结构，学习常用算法以及对其进行实现很有帮助。包括各种排序算法（插入排序，快速排序，选择排序，归并排序，基数排序，计数排序，桶排序、冒泡排序，堆排序等等）、图论算法（最短路径，拓扑排序，关键路径，最小生成树，图的遍历等等）、各种链表、队列、树（二叉树，平衡二叉树，B书，红黑树，哈夫曼编码等等）、字符串操作、内存管理、外部排序、文件操作、哈希散列等等算法。对于每一位学计算机的都有极大帮助。

2011-10-30

程序设计实践(ACM)

一些ACM题目和答案，每个题目都有答案，而且答案运行有时间和空间的严格限制，对于提高编程能力很有帮助，也对参加ACM比赛很有帮助。包括哥德巴赫猜想，食物链，狼群战术，列车长的烦恼，最小生成树，凯撒密码，远古文明的算术，非前缀码，动态生成最小二叉排序树，小明数学题，成对字符串，唯一生成最小二叉树等问题

2011-10-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

我和我追逐的梦~~~

原创 Hadoop与HBase中遇到的问题(续)java.io.IOException: Non-increasing Bloom keys异常

转载机器学习之开源库大总结

转载 Paxos在大型系统中常见的应用场景

原创在数组中寻找和为指定值的两个数

原创在字符串中，寻找第一个只出现一次的字符

原创 Hadoop与HBase中遇到的问题

原创 Hadoop配置文件与HBase配置文件

原创 MapReduce生成HFile文件,再使用BulkLoad导入HBase中(完全分布式运行)

HTML5示例代码

计算机系统结构量化研究方法第四版答案

斯坦福大学机器学习课件pdf格式清晰版

Windows程序设计第五版

计算机硬件知识

计算机图形学

数据结构算法的实现（其中有flash播放）

程序设计实践(ACM)

空空如也

HTML5示例代码

计算机系统结构量化研究方法第四版 答案

斯坦福大学机器学习课件pdf格式清晰版

Windows程序设计第五版

计算机硬件知识

计算机图形学

数据结构算法的实现（其中有flash播放）

程序设计实践(ACM)

空空如也

计算机系统结构量化研究方法第四版答案