- 博客(10)
- 资源 (16)
- 收藏
- 关注
转载 体验WIN7中自带的虚拟机软件-WINDOW VIRTU
转自:http://d1.it168.com/show/29829.html 微软公司总是会在操作系统内集成越来越多的应用软件,虽然这会招致许多应用厂商的反对,但是对于我等D版粉丝来说,总是好事。我的笔记本升级到WIN7后,竟然惊喜的发现,WIN7下只要到网
2011-07-30 15:58:48 1478
转载 9款PDF加密和解密工具
转自:http://paranimage.com/9-pdf-encryption-and-decryption-tools/A-PDF Restrictions Remover让你可以立刻移除PDF文档的密码以及各种限制,它不是一个密码恢复工具,因为在您移除文档
2011-07-30 11:06:23 4035 1
转载 lucene下载与安装
转自:http://blog.csdn.net/shupan001/article/details/5918161下载下载链接:http://apache.mirror.phpchina.com/lucene/java/以选择lucene-2.0.0.zip下载为例。
2011-07-30 09:17:57 611
转载 Lucene的分词器Analyzer
转自:http://www.iteye.com/topic/6855141、抽象类Analyzer其主要包含两个接口,用于生成TokenStream:TokenStream tokenStream(String fieldName, Reader reader);TokenStr
2011-07-28 11:20:47 885
转载 lucene中的Token, TokenStream, Tokenizer, Analyzer
转自:http://ybzshizds.iteye.com/blog/562794Token: 如果一个字段被token化,这表示它经过了一个可将内容转化为tokens串的分析程序。 Token是建立索引的基本单位,表示每个被编入索引的字符。 在token化的过程中,分析程序会在
2011-07-28 11:15:36 897
原创 使用隐马尔科夫模型Viterbi算法解决词性标注问题
中文的有些单词对应多个词性,所以给词标注词性是需要研究的问题。解决此问题的一个方法是从单词的所有可能的词性中选出其最常用的词性作为这个词的词性,也就是一个概率最大的词性。隐马尔可夫模型同时考虑到了次的生成概率与词性之间的转移概率,所以能够提高词性的准确率。 隐马尔可
2011-07-26 10:58:16 3201
原创 提取文档中的文本内容(使用PDFBox处理PDF文档)
由于本节内容与“跟不上时代潮流”的博客里的一篇文章非常类似。在这里谨转载一下。今天看了内容后很是激动,动手编了一下,把电脑里所有的pdf转了一遍,发现用adobe自带的工具转更方便,虽然pdfbox更快一些。粘一下sourceforge里对pdfbox的描述:PDFBox is
2011-07-22 17:18:43 3103 6
原创 Eclipse validate后产生错误的处理
在Eclipse里习惯使用validate选项。可以将自己预设或者选择的错误一下子从整个项目里全部检索出来。 好长时间没有coding了,今天看了一天《自己动手写搜索引擎》,里面的检索pdf文档用的是pdfbox,正好最近因为写论文pdf不能复制烦恼的不行。看到有这
2011-07-22 15:49:46 1743
转载 串和序列的编辑方法
关于字符串的的编辑距离的计算,最经典的两个方法就是树编辑距离和串编辑距离。网页的相似度就是根据这两个方法做到的。(1)字符串编辑距离算法(转自http://hxraid.iteye.com/blog/615469,谢谢Heart.X.Raid啦~~~)我们来看一个实际应用。现代搜
2011-07-16 15:54:53 585
转载 关于如何使用word自定义模板
转自:http://www.redinside.com/bbs/thread-9049-1-1.html有些杂志投稿往往要使用他们做好的模板,到杂志主页相关网页中可以下到,一般都是.dot文件。现在问题出现了,这个下载下来的模板文件是怎么用的?老鸟当然知道了,但新手们通常都会真接
2011-07-12 21:58:04 2152
sqlserver 数据库转sqlite数据软件SqlConverter_v1_17
2011-11-20
给力ppt之任人物登场模板
2011-05-10
如何使用webMatrix做开发 微软web开发利器
2011-04-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人