一些想法:
一、人机对话程序反应速度太慢,一句话一般需要1500ms以上,再加上网络延迟和较大的提问量,速度可能会不理想。
二、购买的语料库很可能需要再次处理。我们的人机对话的智能性一部分是语料库的容量,一部分也要靠分词,如果其他公司或个人的语料库的存取算法和我们不同(极有可能),就需要对其进行处理(如分词)。需要的时间可能不亚于构造语料库。
三、学习的问题。如果希望提问者亦能教机器人问答,那必然需要提问者手动分词,这有两个问题,一个是分词的质量和准确性,一个是根据什么规范,不能要求提问者按照“介词/2个动词/2个名词/3个任意词”的模式进行教授,这过于繁琐,会降低提问者的教授积极性。
一、MSN机器人
- 亮亮机器人MsgerAI@hotmail.com
主页:http://www.funnyok.net/Home/
优点:学习功能,会记住提问者的信息并做出相应的回答(再次登陆后还是记得);
缺点:语料库一般,英文很差
附加功能:据主页介绍,本站绝大部分功能都可以通过MSN机器人:MsgerAI@hotmail.com 实现,测试发现可以实现快速论坛注册、email发送、主页帖子搜索、缩写查询、数学计算、在线学习等功能。
- 小I ince190@hotmail.com
主页:http://www.xiaoi.com/
优点:语料库较大(众多网友为其添加知识库)
缺点:英文很差。
附加功能:http://www.xiaoi.com/func.asp?mode=1
其他:有QQ版本的小I,由于公司限制,未测试
- E娃 bot4@evabot.com
主页:http://www.evabot.com
优点:会些英文
附加功能:http://www.evabot.com/?q=node/view/4
- 捷博MSN精灵
优点:架设自己的MSN机器人,且数据库在本地机子上
缺点:简单的like匹配,智能低
- 中国机器人
主页:http://www.aawns.com/cnrobot/index.asp
优点:可以架设自己的MSN机器人
缺点:数据库在cnrobot服务器上
- 中国机器人cnrobot@cnrobot.net
主页:http://www.aawns.com/cnrobot/index.asp
(由于一直离线,所以无法测试)
- 小布
主页:http://www.9zi.com/
开发者:武汉光衡信息技术有限公司
(由于一直离线,所以无法测试)
- 其他(其他MSN机器人,随意添加了几个,全部离线,晕了)
http://www.charry.org/MSN/article/list.asp?id=152
二、其他机器人
- 端端机器人
主页:http://duanduan.implight.com:8080/
开发者:武汉光衡信息技术有限公司
- 悠悠超人(UC机器人)
(由于公司限制,未测试) - 小强(QQ机器人)
(由于公司限制,未测试)
三、相关URL(排名不分先后)
- 知网:
http://www.keenage.com/html/c_index.html - CIPP-中文信息处理平台
http://www.njnu.edu.cn/wxy/cipp/forum.asp - 北京大学汉语语言学研究中心
http://ccl.pku.edu.cn/resource.asp?item=1 - 北京大学计算语言学研究所
http://icl.pku.edu.cn/default_cn.asp - 纳讯------中文信息处理
http://naxun.sjtu.edu.cn/ - 人工智能研究者俱乐部
http://www.souwu.com/bitfarmer/ - 语言学论文选
http://ling.ccnu.edu.cn/message/yyxlwx/yyxlwx.htm - 中国人工智能网
http://www.chinaai.org/ - 中文语音语言数据联盟
http://www.chineseldc.org/index.htm - 中文自然语言处理开放平台
http://www.nlp.org.cn/
四、其他资料
l 6万条词语分词词库
l 人民日报标注语料1998
l 双语句子对照语料库