常用的中文停用词表

  1. public String[] cn_stopword = { "的""了""在""是""我""有""和""就",  
  2.         "不""人""都""一""一个""上""也""很""到""说""要""去""你",  
  3.         "会""着""没有""看""好""自己""这" };  
 

 

 

首先,我们看下什么是停止词。停止词,是由英文单词:stop word翻译过来的,原来在英语里面会遇到很多a,the,or等使用频率很多的字或词,如果搜索引擎要将这些词都索引的话,那么几乎每个网站都会被索引,也就是说工作量巨大。可以毫不夸张的说句,只要是个英文网站都会用到a或者是the。那么这些英文的词跟我们中文有什么关系呢?

 

在中文网站里面其实也存在大量的stop word,我们称它为停止词。比如,我们前面这句话,“在”、“里面”、“也”、“的”、“它”、“为”这些词都是停止词。这些词因为使用频率过高,几乎每个网页上都存在,所以搜索引擎开发人员都将这一类词语全部忽略掉。如果我们的网站上存在大量这样的词语,那么相当于浪费了很多资源。原本可以添加一个关键词,排名就可以上升一名的,为什么不留着添加为关键词呢?停止词对SEO的意义不是越多越好,而是尽量的减少为宜。

 

其次,我们再看看禁用搜索词。在国外可能政府对网络的监管没有我国的严格,所以他们都是将禁用搜索词和poison word混为一谈了。至于poison word是什么意思,大家可以去百度或者谷歌一下,该词翻译成中文就成了禁用搜索词。那么我们怎样来区分这两类词呢?禁用搜索词在国内其实就是政府规定禁止使用或者说是禁止出现的关键词,而poison word(以下我们简写为PW)就是一些粗俗或者是骂人的词语,这些词语搜索引擎是不喜欢看到的。

    搜索引擎针对PW和禁用搜索词(forbidden search terms简写为FST)是怎样对待的呢,在国内如果出现PW那么搜索引擎会适当的将该网站的权重下调的,表现的结果就是某些关键词的排名下降了;而 FST搜索引擎是直接不显示该网页,或者在你搜索到该网页后会显示该页面存在非法关键词,搜索引擎对这些词的惩罚比较严重,尤其是百度,在出现某品牌牛奶事件以后就开始严厉打击这些现象,其中也从这个方面打击了不少网站。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值