想法是在浏览网页的时候,在浏览器中直接看到的是已经分了词的页面。譬如访问地址“http://news.sina.com.cn/c/2009-08-30/062418540525.shtml”时,页面显示为:
……
广东旅游局 称 将 继续 探索 弹性 黄金周 制度
本报 讯 记者 许琛、通讯员 张晓颖 报道 : 近日 , 省旅游局 称 : 广东 继续 探索 弹性 黄金周 制度 , 为 城乡 居民 提供 相对 集中 的 假期 和 休闲 时间。
……
浏览器考虑采用FireFox,但对它的extension或者plugin开发都不熟。
另外,我现有的分词程序代码是用C++编写的,使用了STL,可以跨平台(Window/Linux)工作。
请大家帮忙出出主意。