自定义博客皮肤

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

lucene中的ListMerger类(多路归并算法的实现)

    linkedIN的开源bobo项目中ListMerger类的分析:     实现的是一个多路归并的算法,构造函数的参数Iterator<T>[] iterators,是一个iterator的array,每个iterator就看作是一个lis...

2012-03-31 16:13:53

阅读数 8

评论数 0

lucene中PriorityQueue类的功能

org.apache.lucene.util.PriorityQueue   PriorityQueue<T>类实际上是一个最大堆,在N中找出最小的M个数字,可以用这个类来做。   可以自己写一个Comparator<T&a...

2012-03-28 16:09:15

阅读数 13

评论数 0

汉字和拼音转换程序java

从网上找的,根据拼音和汉字内码的对照表实现的   原作者的 Googlecode地址: 源码地址: http://code.google.com/p/elainectpy/   /** * @author lixin.wang GB2312 encode */ public ...

2012-03-21 16:27:41

阅读数 13

评论数 0

关于字符编码,你所需要知道的(转贴)

(转贴)原文:http://www.cnblogs.com/KevinYang/archive/2010/06/18/1760597.html 字符编码的问题看似很小,经常被技术人员忽视,但是很容易导致一些莫名其妙的问题。这里总结了一下字符编码的一些普及性的知识,希望对大家有所帮...

2012-03-16 15:18:43

阅读数 7

评论数 0

删除文件夹后maven发布项目svn出错

    team->更新   team->清理   team->更新   就可以了

2012-03-14 14:27:01

阅读数 12

评论数 0

海量数据处理常用思路和方法

大数据量的问题是很多面试笔试中经常出现的问题,比如 google、淘宝、百度、 腾讯 这样的一些涉及到海量数据的公司经常会问到。 下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些...

2012-03-01 16:01:01

阅读数 10

评论数 0

从HTML文件中抽取正文的简单方案

作者:alexjc 译者:恋花蝶(http://blog.csdn.net/lanphaday) 原文地址:http://ai-depot.com/articles/the-easy-way-to-extract-useful-text-...

2012-03-01 15:59:22

阅读数 12

评论数 0

测试数据集,监督数据集,数据挖掘常用的数据集

常用的基本上UCI和w3c的。 关于源代码,网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等。Weka还在不断的更新其算法,下载地址:http://www.cs.waikato.ac.nz/ml/weka/ UCI收集的机器学习数据集ftp://pami.sjt...

2012-03-01 15:06:15

阅读数 20

评论数 0

提示
确定要删除当前文章?
取消 删除