- 博客(14)
- 资源 (24)
- 收藏
- 关注
转载 B- ,B+ , B*树
B-树 是一种多路搜索树(并不是二叉的): 1.定义任意非叶子结点最多只有M个儿子;且M>2; 2.根结点的儿子数为[2, M]; 3.除根结点以外的非叶子结点的儿子数为[M/2, M]; 4.每个结点存放至少M/2-1(取上整)和至多M-1个关键字;(至少2个关键字) 5.非叶
2015-10-29 20:14:40 307
原创 hadoop datanode部分启动不了
整体组织为一个master,三个slavemaster:namenode ,jobtracker,secondarynamenodeslave:datanode,tasktracker在master上执行start-all.sh在master:50070上可以看到只有两个datanode存活然后在没启动成功的datanode上单独启动,再在master:50070上发现新启动的上去
2015-10-28 19:46:37 1969
转载 ant maven gradle
创世之初,世上只有Make一种构建工具,后来,其发展为GNU Make。但是,由于需求的不断涌现,码农的世界里逐渐演化出了千奇百怪的构建工具。当前,JVM生态圈由三大构建工具所统治:Apache Ant带着IvyMavenGradelAnt with IvyAnt是第一个“现代”构建工具,在很多方面它有些像Make。2000年发布,在很短时间内成为Java项目上最流行的构建
2015-10-16 15:27:40 631
转载 Ant简明教程
Ant工具的作用: 1、可以用ant编译java类,生成class文件 2、ant可以自定义标签、配置文件 3、ant可以把相关层架构成包 4、ant把整个项目生成web包,并发布到Tomcat也许你听到别人说起ant,一时冲动准备学习一下ant,当你看完了上边的第一个实例,也许你感觉ant真好,也许你感觉ant不过如此,得出这些结论都 不能说错,虽然ant很好用,但并不是
2015-10-16 12:35:34 327
转载 RPC与RMI区别
远程对象方法调用并不是新概念,远程过程调用(RPC-remote procedure call)已经使用很多年了。远程过程调用被设计为在应用程序间通信的平台中立的方式,它不理会操作系统之间以及语言之间的差异。即RPC支持多种语言,而RMI(Remote Method Invocation)只支持Java写的应用程序。 另外RMI调用远程对象方法,允许方法返回Java对象以及基本数据
2015-10-12 14:19:24 661
原创 自己写爬虫
最近因为论文的原因,需要爬取一些文本数据。所以找了本书看了一下,写了一个爬虫程序,和对原始爬取数据的清洗程序。第一版程序没有用到线程的概念,所以比较慢,第二版用了线程,速度确实提升了很多。爬虫用到了几个包:commons-httpclient-3.0.1.jarhtmlparser.jar第一个是模拟浏览器http的包,第二个是解析网页的包。一般情况下,爬虫用的策略为广度优
2015-10-12 14:13:50 505
转载 Mapreduce初级案例
1、数据去重 "数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。1.1 实例描述 对数据文件中的数据进行去重。数据文件中的每行都是一个数据。 样例输入如下所示: 1)file1:
2015-10-05 10:50:41 748
转载 mapreduce数据排序
我们的需求是想统计一个文件中用IK分词后每个词出现的次数,然后按照出现的次数降序排列。也就是高频词统计。由于hadoop在reduce之后就不能对结果做什么了,所以只能分为两个job完成,第一个job统计次数,第二个job对第一个job的结果排序。 第一个job的就是hadoop最简单的例子countwords,我要说的是用hadoop对结果排序。 假设第一个job的结
2015-10-04 15:52:50 1467
转载 java中调用dll文件的两种方法
原文:http://blog.csdn.net/jimmy609/article/details/19076557一中是用JNA方法,另外是用JNative方法,两种都是转载来的,JNA地址:http://blog.csdn.net/shendl/article/details/3589676 JNative地址:http://www.jb51.net/article/
2015-10-03 15:40:12 799
原创 论文相关
http://www.china-cloud.com/yunjishu/shujuzhongxin/20150311_45622.html
2015-10-03 15:38:41 391
转载 c语言的正则表达式
标准的C和C++都不支持正则表达式,但有一些函数库可以辅助C/C++程序员完成这一功能,其中最著名的当数Philip Hazel的Perl-Compatible Regular Expression库,许多Linux发行版本都带有这个函数库。C语言处理正则表达式常用的函数有regcomp()、regexec()、regfree()和regerror(),一般分为三个步骤,如下所示:
2015-10-03 10:07:40 404
转载 二叉树的深度优先遍历和广度优先遍历
深度优先遍历,也就深入的遍历,沿着每一个分支直到走到最后,然后才返回来遍历剩余的节点。二叉树不同于图,图需要标记节点是否已经访问过,因为可能会存在环,而二叉树不会出现环,所以不需要标记。那么,我们只需要一个栈空间,来压栈就好了。因为深度优先遍历,遍历了根节点后,就开始遍历左子树,所以右子树肯定最后遍历。我们利用栈的性质,先将右子树压栈,然后在对左子树压栈。此时,左子树节点是在top上的,所以可以先
2015-10-02 19:52:51 418
转载 java native方法及JNI实例
1.参考文献:http://blog.csdn.net/youjianbo_han_87/article/details/2586375http://blog.csdn.net/yangjiali014/article/details/1633017http://blog.chinaunix.net/space.php?uid=7437948&do=blog&id=20
2015-10-01 21:21:16 386
原创 多字段排序处理
排序是很常用的算法当对多个字段考虑排序时,不需要对字段一排序后再排字段二。只需要将字段一与字段二合并,然后按照相应规则排序。这样排序结果就是首先按照字段一排序,次级按照字段二排序如下:姓名语文数学总分王小明9570165张小红8976165张二蛋9090 180如
2015-10-01 16:19:41 1883
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人