开源搜索引擎
lixiaobai
浮生不恨欢娱少,明月轻风自在怀
展开
-
中科院ICTCLAS词典解析
中科院ICTCLAS词典解析程序 C# 代码 作者: 宁夏大学 张冬 2006.12.29中科院ICTCLAS词典 采取了2进制的存储方式 对其它开发者使用造成了一些困扰 我写了一个解析程序 希望对大家有所帮助 可以在 http://gforge.osdn.net.cn/projects/xunlong/ 下载1 解析ICTCLAS的词典 首先要建立一个 字符对照表原创 2007-02-05 10:23:00 · 2152 阅读 · 2 评论 -
中科院ICTCLAS词典解析程序 C# 代码
中科院ICTCLAS词典解析程序 C# 代码 作者: 宁夏大学 张冬 也可以在 http://gforge.osdn.net.cn/projects/xunlong/ 下载FormWordEdit.csusing System;using System.Collections.Generic;using System.ComponentModel;using System.Data;usin原创 2007-02-05 10:26:00 · 3170 阅读 · 4 评论 -
构建英汉机器翻译项目
机器翻译是个非常复杂的问题,其应用价值也非常的,但是 根据在网络上查找到的资料,也许SMT将是MT的救命稻草。但是我们的问题不是统计学能够简单完成的,我觉得机器翻译的解决方法必然是通过机器学习来解决。虽然说我们人学习语言的过程中充满了创造,但不可否认,这个过程的基础和很大比例来源于对已知语言的模仿。Alice的成功给了我们很大的启发,就是如果想建立起一个解决所有问题的方案,那么可能会失败但是建原创 2007-02-05 10:27:00 · 2052 阅读 · 1 评论 -
可用的在线中英文语料库
下面是一些 可用的在线中英文语料库 适合于教育网用户使用 速度较快http://dict.yodao.com/http://dj.iciba.comhttp://dict.baidu.com/http://dict.cnhttp://mtgroup.ict.ac.cnhttp://www.xmuoec.com具有很多英语和汉语对齐的句子不过 今天理解了一句话 资本的原始积累是血淋淋的 语料原创 2007-02-05 10:29:00 · 3324 阅读 · 2 评论 -
NLP 和 搜索 、机器视觉 /机器翻译
不知道我们宁大是否有研究 NLP 和 搜索 、机器视觉 /机器翻译 方面的同学 有兴趣大家交流交流 我的blog: HTTP://ZD4004.BLOG.163.COM原创 2007-03-26 22:41:00 · 1370 阅读 · 0 评论 -
开源英汉机器翻译C#.NET项目 www.liebiao.net
开源英汉机器翻译C#.NET项目 www.liebiao.net原创 2007-04-18 07:43:00 · 1876 阅读 · 1 评论 -
开源(open source)英汉机器翻译 C#.NET 源代码 www.liebiao.net
开源(open source)英汉机器翻译 C#.NET 源代码 www.liebiao.net大家交流研究原创 2007-04-21 07:23:00 · 2882 阅读 · 0 评论 -
开源心得
半年前发布了 迅龙的开源项目 因为是基于几个开源的基础上的 所以按照协议继续开源本来是一个很好的事情 可是 其中的有些问题让人郁闷1 一部分下载到代码的同志 , 不怎么看附带的文档和代码 只看一下模块名称 就 来问我 因为是一些基本问题 所以 我想 仔细看一下就可以解决2 一部分同志直接说自己没时间看 希望我讲一讲 这个本身是有问题的 没时间看就别看原创 2007-04-07 19:21:00 · 2025 阅读 · 11 评论 -
迅龙的数据库反向还原算法结构
迅龙的数据库反向还原算法 结构 迅龙的信息抽取算法 通过小规模采样的机器学习方法来处理半结构化的Web数据主要有5个部分1 采样: 得到可能有来源于一个动态页面程序的一个URL队列2 自动分析: 得到采样队列对应的数据队列 得到一个原始模板3 自动标注: 根据采样结果和原始模板 标注得到一个滤波模板4 手工标注: 手工修正自动生成的结果5 自适应过滤: 对于不同的页面数据 自动适应不同的过原创 2007-03-04 17:41:00 · 1297 阅读 · 0 评论 -
迅龙讨论组 ( 在这里提问 ):http://gforge.osdn.net.cn/forum/?group_id=50
迅龙讨论组 ( 在这里提问 ):http://gforge.osdn.net.cn/forum/?group_id=50原创 2007-03-04 15:29:00 · 1305 阅读 · 0 评论 -
迅龙中文开源Web搜索引擎的目标
提供更容易部署的中等规模搜索引擎方案,使得搜索技术可以很快渗透到中文相信处理的各个角落,做开源的中文OmniFind。 国内搜索引擎市场现在较热,非常多的技术人员不断加入,技术方面重复建设的事情太多,我们如果总是在基本的问题上徘徊,那么最后,我们到底能够积累下多少搜索技术。 我们如今在国外和国内优秀开源成果基础上做一个开源的中文搜索引擎项目,选用.NET 平原创 2007-03-01 17:26:00 · 2312 阅读 · 3 评论 -
博客地址
主力博客 请前往http://blog.163.com/zd4004/原创 2006-12-14 07:32:00 · 1136 阅读 · 0 评论 -
IBM OmniFind Yahoo! Edition
IBM联合YAHOO推出针对企业的企业搜索软件----IBM OmniFind Yahoo! EditionIBM OmniFind Yahoo! Edition 是一个免费的入门级企业搜索软件解决方案,它允许 Web 站点和 Web 应用程序的管理者和开发者快速部署面向 Internet、Intranet 与文件系统的搜索引擎,为企业的员工和客户服务。但是好像是限制索引条目数量在50万以原创 2007-02-11 18:30:00 · 1204 阅读 · 0 评论 -
C# 判断句子中是否含有中文
/// /// 判断句子中是否含有中文 宁夏大学 张冬 zd4004.blog.163.com /// /// 字符串 public bool WordsIScn(string words) { string TmmP; for (int i = 0;原创 2007-02-13 21:40:00 · 1487 阅读 · 1 评论 -
C# 清除某个标签的属性值 源代码
/// /// 清除某个标签的属性值 宁夏大学 张冬 zd4004.blog.163.com /// /// /// /// private string clearOneTag(string data, string tagn, string valc) {原创 2007-02-13 22:17:00 · 1337 阅读 · 0 评论 -
C# URL中的http链接进行分析,将相对路径转换为绝对路径 源代码
/// /// URL中的http链接进行分析,将相对路径转换为绝对路径 /// 宁夏大学 张冬zd4004.blog.163.com /// /// /// /// public string Data2Url(string surl, str原创 2007-02-13 22:18:00 · 3329 阅读 · 1 评论 -
使用C# 用MD5进行密码加密源代码
我们一般在应用中经常需要加密密码 .Net 平台提供了直接的函数可以完成 哈希算法给密码加密的工作例如 string newpassword = System.Web.Security.FormsAuthentication.HashPasswordForStoringInConfigFile(password, "md5");根据指定的密码和哈希算法生成一个适合于存储在配置文件中的哈希原创 2007-02-13 22:19:00 · 3196 阅读 · 0 评论 -
切,你做开源难道不是为了钱?
如果你现在还认为开源编程只是某些程序员为了自己的爱好或者是为了满足自己的需求而做的事情的话,那只能说明你太天真了。Linux Foundation 最近做了一份调查报告(Collaborative Development Trends Report 2014),结果显示:今天的软件开发者之所以参与开源项目,只不过是为了钱而已。可能大家脑海里常出现的景象就是一个程序员在黑暗的小屋里使用E转载 2014-04-27 01:08:40 · 1881 阅读 · 0 评论