- 博客(5)
- 资源 (41)
- 收藏
- 关注
原创 搜索引擎算法之初探——PageRank、DocRank
从文档集合中找出出现搜索词的文档,进一步可能是通过搜索词在文档中出现的次数来对文档排名,这种搜索就是信息检索(Information retrieval)。有很多现有的库可以很方便的就让我们做出来这些工作,其中最有名的当属Lucene了。当然,现在的搜索已不单单是索引了,而在于链接分析、用户点击分析和自然语言处理等方面,这些技术能大大的增强搜索的性能。基本搜索构建一个搜索引擎的基本步骤
2013-07-27 21:45:58 2417
原创 CRF++条件随机场 总结
http://crfpp.googlecode.com/svn/trunk/doc/index.html#install1. 简述 最近要应用CRF模型,进行序列识别。选用了CRF++工具包,具体来说是在VS2008的C#环境下,使用CRF++的windows版本。本文总结一下了解到的和CRF++工具包相关的信息。 参考资料是CRF++的官方网站:CRF++:
2013-07-26 11:27:10 4505 1
原创 字符串编辑距离
题目如下,最后给出实现代码,该代码仍在测试中,仅供学习交流! 编写一个程序计算两个字符串的编辑距离。编辑距离的定义和计算方法如下: Given two strings A and B, edit A to B with the minimum number of edit operations:a) .Replace a letter with another letter
2013-07-11 11:44:56 1294
原创 LD 算法实现(编辑距离算法)
LD算法就是自然语言处理(NLP)里的“编辑距离”算法。俄国科学家Levenshtein提出的,故又叫Levenshtein Distance (LD算法)【定义】设A和B是两个字符串。将字符串A转换为字符串B所用的最少字符操作数称为字符串A到字符串B的编辑距离。( 这里所说的字符操作包括:删除一个字符,插入一个字符,修改一个字符)如果有人想看具体算法的描述还是自己去搜吧。
2013-07-11 10:13:09 1564
原创 利用HTK快速建立一个语音命令识别系统
工具包介绍 HTK的全称是“Hidden Markov Model Toolkit”,是英国剑桥大学工程学院开发的隐马尔可夫模型(后面简称为隐马模型)工具包,可以方便有效的建立及操作隐马模型。隐马模型在许多人工智能领域都有着成功的应用,比如语音识别,当前国际上主流的语音识别系统仍是基于隐马模型建立的。HTK的开发也主要是针对语音识别的应用及研究。 HTK
2013-07-05 16:43:58 2832
OpenRS— 开放式遥感数据处理与服务平台资料
2009-06-19
TinyXML解析xml文档
2008-12-29
Web+Services发布与调用(axis,xfire).doc
2008-12-27
COM+ Services.doc
2008-08-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人