机器人-小叮咚
JCJC错别字检测-田春峰
这个作者很懒,什么都没留下…
展开
-
小叮咚机器人 ( 瞄瞄的版本 )
??? 和 瞄瞄?? 联系后,取得了这个小机器人的代码。正好我也有这个需求,所以准备继续瞄瞄这个版本继续开发,继续公开源代码。 ?? 现在的设想架构如下:我也给用瞄瞄得代码 启动了机器人 服务:小叮咚:xiaodingdong21@hotmail.com? 感兴趣大家可以添加。准备添加的功能:1、后台自动发送邮件的程序(Java Mail,WEB版) 参考资料:MSN进行时原创 2004-08-13 09:02:00 · 5320 阅读 · 14 评论 -
一种面向搜索引擎的中文切分词方法
一种面向搜索引擎的中文切分词方法 首先说一下搜索引擎切分词的产生的原因。 在进行全文检索时,首先将要检索的内容分割成较短的文字序列。然后生成在每个文字序列中所包含字符串的对应表(索引)。当输入检索语句后,也同样进行分割,与索引进行比较。也就是说,两者即使包含有同样的文字排列,但分割方法不同的话也不能正确检索。 文字的分割方法主要有两种,分别是 词语解析索引 和 文字索引 。原创 2005-01-08 11:51:00 · 11910 阅读 · 5 评论 -
计算所汉语词法分析系统ICTCLAS 字典格式解析(字典格式说明)
在 计算所汉语词法分析系统ICTCLAS 字典格式解析 一文中简单介绍了一下 ICTCLAS 。本来是要把字典格式一并写上去,无奈不知道怎么描述这个格式,现在终于写出了第一个Java版本的代码,也理清了思路。这个文件格式可以这样来描述: 先用文字描述一下: ictclas的字典文件由结构相同的Segment组成(比如:英文字典可以按照词语的首字母分为26个Segment原创 2005-01-03 12:32:00 · 4470 阅读 · 1 评论 -
实现文本自动分类的基础----Term频率计算方法
实现文本自动分类的基础----Term频率计算方法 据说如今互联网上的文档每天以100万的数量增长,这么大的增长量使得Google可能需要1个月甚至更长的时间才能光顾你的网站一次。所以如果你今天对你的网页做了优化,那么1个月后在看Google的反应吧。这真是信息爆炸的年代。互联网刚诞生的时候,通过目录导航机制,我们就能找到所需要的信息,Yahoo抓住这个机会成功了;后来随着互联网的普及原创 2005-01-26 23:05:00 · 4040 阅读 · 3 评论 -
基于最长词匹配算法变形的分词系统( 文舫工作室贡献 )
基于最长词匹配算法变形的分词系统( 文舫工作室贡献 ) 这个分词程序是文舫工作室贡献出来的。 强烈推荐看看文舫工作室的开发日志,他们的激情可以鼓励很多人...... 自从小叮咚分词程序发布后,很多软件行业的朋友们都来信索取,因为定位的问题,所以小叮咚的分词程序和 ICTCLAS的算法完全不同的。 小叮咚的分词程序的定位是为搜索引擎服务的。可以参考:一原创 2005-07-13 18:24:00 · 5650 阅读 · 0 评论 -
决策树,向量机 的一些研究生名单
原创 2005-04-08 21:27:00 · 3024 阅读 · 0 评论 -
计算所汉语词法分析系统ICTCLAS 字典格式解析
计算所汉语词法分析系统ICTCLAS 字典格式解析 这段时间小叮咚分词模块基本上没有什么大更新了,不是不想更新,而是感觉好像碰到了天花板,不知道该如何进一步拓展分词的功能了。当然分词不是目的,只是为了让小叮咚理解自然语言的一步必须的中间环节。我对小叮咚的定位是一个智能知识问答系统。这样让小叮咚理解用户输入的内容是最基础也最关键的一步。我们学习一门语言,首先要了解句子的构成,句子的成份,原创 2004-12-23 23:19:00 · 8736 阅读 · 65 评论 -
机器人 小叮咚的 中文分词终于跨出了第一步
机器人 小叮咚的中文分词终于跨出了第一步机器人 小叮咚的帐号:QQ: 443803193Msn: xiaodingdong21@hotmail.com 主页: http://xiaodingdong.myshow.cn/index.asp网络上有很多算法,借鉴了一下,然后自己用最普通得方法做了一个分词现在还没有和小叮咚集成,等效果比较满意后,加入小叮咚得原创 2004-11-12 15:38:00 · 4130 阅读 · 5 评论 -
祝贺:小叮咚 现在开始用 JMX 管理
JMX 可真是一个强大的东西,如果你还不熟悉JMX请参考这里:Java 5.0 内置了JMX 现在小叮咚 xiaodingdong21@hotmail.com 可以使用JMX来管理了,下图是 发送消息的一个截图QQ “只爱陌生人”,MSN “不和陌生人说话”。Evolving JMX http://www.sys-con.com/story/print.cfm?storyid=4686原创 2004-10-13 18:19:00 · 1851 阅读 · 2 评论 -
集成 JBoss AOP 1.0 和 java 5 的 Annotation 制作 小叮咚 日志系统
JBoss AOP 1.0 发布 和 在小叮咚中的例子小叮咚 的框架中用了很多的第三方包,大部分都用 log4j ,xu必须打开debug的标志,打印的信息又很多,所以准备作个日志模块,记录小叮咚每天的行为. 正好JBoss AOP 和 java 5 都发布了,所以集成这两个工具来作.参考文章:http://www.onjava.com/pub/a/onjava/2004/08/25/aoa.原创 2004-10-28 11:12:00 · 3451 阅读 · 0 评论