- 博客(8)
- 资源 (6)
- 收藏
- 关注
转载 说书(评书)术语
转自:http://zhidao.baidu.com/question/77444033.html开头说:上回书说到……结尾说:欲知后事如何,且听下回分解。常用语:时迟,那时快;话说……;花开两朵,各表一枝;单田芳老师的评书有许多常用的套语,以
2011-08-29 09:16:51 4965 1
原创 Trie,字典树
前两天,写了一个字典树,感觉不太好,有点臃肿。下面是根据网友的帖子(http://www.ej38.com/showinfo/java-184775.html,google搜索的,不晓得哪个是原创了),修改后的样子。package ruc.datasearch.t
2011-08-20 15:25:36 1254
转载 Java传参是传值还是传址? 转一篇很精练的文章
转自:http://hi.baidu.com/cuiyueboke/blog/item/4be6bfec85f0e53f26979113.html今天回想起来Java考试时有这么一道题,先不说别的,先看看下面这段代码:public class MyDemo {
2011-08-16 17:30:56 1576 1
原创 Edit Distance(Dynamic Programming,动态规划算法实现)
Edit Distance即编辑距离,衡量两个字符串的相似度的方法,详细可以搜索维基百科,核心思想是计算一个字符串要通过多少次的“插入、删除、替换”字符操作转变成另一字符串。Java实现如下:package ruc.database.similarity;
2011-08-15 22:33:09 2195
原创 Jaccard Coefficient(Jaccard Similarity)
Set s and Set tJC(s,t)=|s∪t|/|s∩t|Java实现如下所示:package ruc.database.similarity;import java.util.ArrayList;import java.util.Li
2011-08-15 22:30:39 4241
转载 Java中Character和char的区别
不解释,参见: http://topic.csdn.net/u/20080904/17/292dd137-b818-4fd6-8ea0-b6f6109a3381.html
2011-08-14 19:30:44 2811
原创 similarity join(record linkage, merge/purge, deduplicate)总结
join的时候一般有如下的特点:数据集较大,但是能够join的数据相对非常非常的少。1. 为了提高join的效率一般有两种做法 1.1 Cartesian product的时候用cost较小的function来判断其相似度不能达到阈值,从而避免用c
2011-08-14 14:22:11 2072
转载 Soundex
本文转载自:http://zh.wikipedia.org/wiki/SoundexSoundex是一种语音算法,利用英文字的读音计算近似值,值由四个字符构成,第一个字符为英文字母,后三个为数字。在拼音文字中有时会有会念但不能拼出正确字的情形,可用Soundex做
2011-08-10 09:44:43 629
Oxygen XML Editor破解(10和12的破解包)
2012-03-11
用viso写的邮局订报系统ER图( 实体联系图)
2009-05-02
用C#写的较完整的词法分析器
2009-04-21
C#编写的简单词法分析
2009-04-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人