自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (6)
  • 收藏
  • 关注

转载 说书(评书)术语

转自:http://zhidao.baidu.com/question/77444033.html开头说:上回书说到……结尾说:欲知后事如何,且听下回分解。常用语:时迟,那时快;话说……;花开两朵,各表一枝;单田芳老师的评书有许多常用的套语,以

2011-08-29 09:16:51 4957 1

原创 Trie,字典树

前两天,写了一个字典树,感觉不太好,有点臃肿。下面是根据网友的帖子(http://www.ej38.com/showinfo/java-184775.html,google搜索的,不晓得哪个是原创了),修改后的样子。package ruc.datasearch.t

2011-08-20 15:25:36 1254

转载 Java传参是传值还是传址? 转一篇很精练的文章

转自:http://hi.baidu.com/cuiyueboke/blog/item/4be6bfec85f0e53f26979113.html今天回想起来Java考试时有这么一道题,先不说别的,先看看下面这段代码:public class MyDemo {

2011-08-16 17:30:56 1576 1

原创 Edit Distance(Dynamic Programming,动态规划算法实现)

Edit Distance即编辑距离,衡量两个字符串的相似度的方法,详细可以搜索维基百科,核心思想是计算一个字符串要通过多少次的“插入、删除、替换”字符操作转变成另一字符串。Java实现如下:package ruc.database.similarity;

2011-08-15 22:33:09 2192

原创 Jaccard Coefficient(Jaccard Similarity)

Set s and Set tJC(s,t)=|s∪t|/|s∩t|Java实现如下所示:package ruc.database.similarity;import java.util.ArrayList;import java.util.Li

2011-08-15 22:30:39 4241

转载 Java中Character和char的区别

不解释,参见: http://topic.csdn.net/u/20080904/17/292dd137-b818-4fd6-8ea0-b6f6109a3381.html

2011-08-14 19:30:44 2810

原创 similarity join(record linkage, merge/purge, deduplicate)总结

join的时候一般有如下的特点:数据集较大,但是能够join的数据相对非常非常的少。1. 为了提高join的效率一般有两种做法   1.1 Cartesian product的时候用cost较小的function来判断其相似度不能达到阈值,从而避免用c

2011-08-14 14:22:11 2072

转载 Soundex

本文转载自:http://zh.wikipedia.org/wiki/SoundexSoundex是一种语音算法,利用英文字的读音计算近似值,值由四个字符构成,第一个字符为英文字母,后三个为数字。在拼音文字中有时会有会念但不能拼出正确字的情形,可用Soundex做

2011-08-10 09:44:43 629

Oxygen XML Editor破解(10和12的破解包)

Oxygen XML Editor破解(10和12的破解包),可以破解版本10 和 版本12 ,更高版本的13没有测试过。 使用时请看附件中的说明

2012-03-11

A Guide to the Theory of NP-Completeness

一本介绍NPC问题的很好的学习书籍,涵盖了npc问题的方方面面,是一本良好的工具书。

2011-04-08

asp.net 切图 图库 图片展示

使用javascript写的图片上传、处理,包括切图。 使用javascript写的图片展示部分,仿照163图库展示

2011-04-08

用viso写的邮局订报系统ER图( 实体联系图)

用viso写的邮局订报系统的ER图。 其中的定义了四个主要实体:会员,报刊,管理员和订单。 参考此ER图模型可以快速方便地定义出数据库实体模型

2009-05-02

用C#写的较完整的词法分析器

一个可以识别标识符,关健字,运算符和各种数字的词法分析器. 其中标识符,关键字,运算符,界符存储在一个四行的二维数组中,只要将需要识别的串加入到相应的数组中即可,而且不需要结束标志 例如: for(int i=0;i<intput.length;i++) 输出结果为: for:是关键字 (:是界符 int:是关键字 =:是算数运算符 0:是数字 ;:是界符 i:是标识符 <:是比较运算符 intput:是标识符 .:是界符 length:是关键字 ;:是界符 i:是标识符 ++:是算数运算符 ):是界符

2009-04-21

C#编写的简单词法分析

词法分析 C# 编译原理 关键字: auto double int struct break else long switch case enum register typedef char extern return union const float short unsigned continue for signed void default goto sizeof volatile do while static f 标识符: (常量名,变量名,过程名) 1. 所有标识符必须由一个字母(a~z或A~Z)或下划线(_)开头; 2. 标识符的其它部分可以用字母、下划线或数字(0~9)组成; 3. 大小写字母表示不同意义, 即代表不同的标识符,如前面的cout和Cout; 识别与C语言词法规定相一致的标识符,通过下列正则表达式定义:ID = letter (letter | digit)*; 常 数: NUM=(+ | - |ε)digit digit*(.digit digit* |ε)(e(+ | - |ε) digit digit* |ε),letter = a|..|z|A|..|Z|,digit = 0|..|9,包括整数,如123, -123, +123等;小数,如123.45, +123.45, -123.45;科学计数法表示的常数,如+1.23e3,-2.3e-9; 运算符: + - * / < <= > >= == != = 界 符: ( ) [ ] { } ; , /* */

2009-04-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除