- 博客(3)
- 收藏
- 关注
原创 评论《怎样度量信息》
Google黑板报上有一个系列《数学之美》非常的不错,到目前为止共有四期,链接分别如下:http://googlechinablog.com/2006/04/blog-post.htmlhttp://googlechinablog.com/2006/04/blog-post_10.htmlhttp://googlechinablog.com/2006/04/4.htmlhtt
2006-04-29 16:47:00 4951 3
原创 search花絮之语义处理
语义处理是自然语言处理前沿的热点,其关键作用正逐渐成为学科领域的共识,而我们的中文信息处理强项也在于语义处理,所以很自然就想把这一优势具体体现到搜索项目中来——但毫无疑问这是一个摸索的过程。最初我负责标题分析的研究,曾随机抽取了一些标题示例,例如: “移动存储设备”的例子[[+[移动存储设备]与[读写识别设备]]的[安全[认证方法]]][[改变移动存储设备[+功能或状态]
2006-04-12 11:47:00 1998 3
原创 search花絮之堆合并
大规模词库的词汇检索是一个非常耗时的操作,所以其数据结构一般都是需要经过仔细设计的。单位里原有一个堆结构,最近将它模板化,并在它基础上做模糊查询。但原来没有词库的归并算法,这些日子不得不重新实现一个。算法的难点在于寻找合适的子块进行move操作以及调整该子块的所有相关指针。下面是测试例子之一:int _tmain(int argc, _TCHAR* argv[]){ CWo
2006-04-11 11:12:00 1114
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人