分词
cnhuduo
这个作者很懒,什么都没留下…
展开
-
分词标准的选择
www.bijiaohao.com和www.jiucool.com.cn 比较好做的是垂直搜索,一般分词都是考虑中文分词用单字+词库检索的,对于顺序一般没有定义。 比如我搜索 红酒 得到的就是红+酒,定义优先级这个是必须得,但是也可能出现 酒红出现在结果里。 如果做大众搜索一般都会有用户检索两达到一定程度的词获得一个比较高的优先级,而且会作为匹配最好原创 2010-03-16 17:25:00 · 396 阅读 · 0 评论 -
做好优化要懂得分词
分词准确性对搜索引擎来说十分重要。即使准确性再高,但如果分词速度太慢。对于搜索引擎来说也是不可用的因为搜索引擎需要处置数以亿计的网页,如果分词耗用的时间过长,会严重影响搜索引擎内容更新的速度。因此对于搜索引擎来说,分词的准确性和速度,二者都需要达到很高的要求。目前研究中文分词的大多是科研院校,清华、北大、中科院、北京语言学院、东北大学、 IBM 研究院、 微软 中国研究院等都有自己的研究队伍,而真原创 2010-03-16 17:02:00 · 545 阅读 · 0 评论 -
谷歌退出百度真的会获利么?必应何去何从!
今儿一早谷歌还是没有任何消息,商务部也没有接到任何消息和通知。在彩和坊路和丹棱街交汇处的财富大厦,百度的员工们热情澎湃的拿着印有目前在谷歌投放广告的客户单四处奔波着,就是在去楼下快客的时候也不忘记打着手机宣传着百度的最新营销方案。难道谷歌退出了,百度真的就收益了么。昨儿一个不久前从百度跳到谷歌的朋友和我抱怨说,不要以为你在bing就安稳了。目前形势很不利啊。我道:“难道转载 2010-03-18 11:23:00 · 448 阅读 · 0 评论 -
百度的关键词库,词汇的精准定义与排序
http://blog.sina.com.cn/s/blog_3dc771f40100hldl.html 最近发现了个问题。也就是百度的关键词库。百度的关键词库现在很有意思。最近一个朋友的网站遇到了这种情况。也就是他的网站是“酒酷网”那么检索酒酷网就是他们网站第一位。但是在百度检索“酒酷”的时候排序却很有意思。匹配的都是酒酷在标题中的网页。各类媒体新闻等等。转载 2010-03-26 10:28:00 · 1049 阅读 · 0 评论