Analyze Comment
文章平均质量分 77
peter-wang
这个作者很懒,什么都没留下…
展开
-
中文机械分词算法
机械分词方法又叫基于字符串匹配的分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行区配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。按照扫描方向的不同,串匹配分词方法可以分为正向匹配和逆向匹配;按照不同长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短)匹配;按照是否与词性标注过程相结合,又可以分为单纯分词方法和分词与标注相结合的一体化方法。常用的几转载 2007-12-04 17:24:00 · 1283 阅读 · 1 评论 -
八种常见的防盗链方法总结及分析
作为普通的网民来说,一般不需要知道也不用关心什么是盗链,不过如果你是网站的开发者或维护者,就不得不重视盗链的问题了。如果你刚刚开发完一个没有防盗链的带有文件下载功能的网站,挂上internet,然后上传几个时下非常热门的软件或电影并在网站内公布下载地址,让MSN上的所有好友都来体验一下你的杰作。不用多久就会发现网速出奇地变慢,甚至服务器托管中心的服务员会热情地打电话告诉你的网站流量很大,估计是网站原创 2008-08-20 10:45:00 · 1536 阅读 · 0 评论 -
实现文本自动分类的基础--Term频率计算方法
实现文本自动分类的基础----term频率计算方法 据说如今互联网上的文档每天以100万的数量增长,这么大的增长量使得google可能需要1个月甚至更长的时间才能光顾你的网站一次.所以如果你今天对你的网页做了优化,那么1个月后在看google的反应吧.这真是信息爆炸的年代.互联网刚诞生的时候,通过目录导航机制,我们就能找到所需要的信息,yahoo抓住这个机会成功了;后来随着互联网的普及,信息转载 2008-08-25 10:50:00 · 925 阅读 · 0 评论