Anders Liu (lover_P)的.NET天空

传播知识基于掌握知识,但又高于掌握知识。我要做一个掌握很多知识的传播知识的人!

Anders Liu
Anders Liu的公告


我写的书


购买途径:
最近评论
mldstk:wow power leveling
l763820708:有-在17号端口
txfast:这些话说的比较实际,其实说学习能力强只是一句空话,因为刚进公司,谁能够认可你的学习能力强,谁又能否定一个人的学习能力?
Wind_Eagle:想不到情人节还有心思写博客呀!不错,我有同感 !
heaso14:照着做了 还是有问题啊...

1>MSVCRT.lib(crtexew.obj) : error LNK2001: 无法解析的外部符号 _WinMain@16
1>C:\Documents and Settings\Administrator\My Documents\Visual Studio 2005\Projects\a\PureC\Rele……
文章分类
收藏
    相册
    MVP Logo
    文章用图1
    存档
    软件项目交易
    订阅我的博客
    XML聚合  FeedSky
    订阅到鲜果
    订阅到Google
    订阅到抓虾
    订阅到BlogLines
    订阅到Yahoo
    订阅到GouGou
    订阅到飞鸽
    订阅到Rojo
    订阅到newsgator
    订阅到netvibes

    原创 [召集] 关键字屏蔽二三收藏

    新一篇: 盗版不是这样打的 | 旧一篇: [召集] 关于名词复数形式的翻译

    任何网上言行都应该文明。所以出现了关键字屏蔽一说。也就是把用户发表的文字中的不文明词汇加以替代。

    一般的做法,好像就是准备一个关键字列表,然后遍历用户输入的文本,当发现不文明词汇时,将该词汇替换为指定内容。

    所以,就出现了很多搞笑的内容。我举几个简单例子(也不知道CSDN会不会屏蔽掉),看看朋友们能不能猜出被屏蔽的内容(本文后面给出答案):

    1 谋网游,“在没有你的**子里”;
    2 某blog,“微软的这项技术极**利了开发者的工作”;
    3 某技术网站,“把Virtual Server当作一**立的服务器”;

    最近打算自己写个blog玩玩,练练技术顺便检验一下自己的水平。不由得想到了内容审核和关键字屏蔽问题,也不由得想到了自己过去遇到的这些哭笑不得的“不文明内容”。

    -- Begin: Thinking Section --
    关键字屏蔽,本身是一件好事情,而且其技术研究起来也会比较有意思。但是在做关键字屏蔽时,要清楚自己的目的。

    Anders Liu认为,关键字屏蔽存在的主要目的有二:

    1 免责。将关键字替换为**或其他内容,避免了用户通过在搜索引擎中输入不文明词汇(包括政治词汇)来找到自己站点中的内容,同样也避免了好事之人通过此途径找到自己的站点,这将给站点的管理者们减少很多麻烦。

    2 文明。自己的站点看上去“形势一片大好”,多么和谐。

    然而,关键字屏蔽真的能实现这两个目的了么?给大家讲个老笑话:
    A:老C说话可真脏!
    B:他说什么了?你把脏话去掉再说给我。
    A:我,你,他。
    B:……

    想想看,当漫山遍野都是关键字屏蔽带来的***,作为站点管理员就没有责任吗?这个网站就“文明”吗?

    况且,关键字屏蔽是很容易被突破的,用户可以随意编纂一些大家都看得懂,唯独关键字屏蔽系统看不懂的词汇,来表达他“不文明”的思想。后面给出答案时,也会给出一些逃避方法。

    那如果把关键字列表做得庞大些,甚至加入自学习功能,可以不断添加词条呢?物极必反,当屏蔽的关键字太多时,就会出现比本文前面例子更加哭笑不得的言语。

    应该怎么办?

    对于个人开发者,像Anders Liu这样子想自己写着玩的,我想我会准备一个可以扩充的关键字列表,当发现“不文明词汇”时,给用户一个提示,“您输入的内容‘……’中有敏感词汇‘xxx’,您可以:点击[Yes],坚持发表我的内容;点击[No],换一种说法后再发表”,同时将输入框焦点放置到出现问题的文本上。

    对于企业或者营利性网站而言,Anders Liu则认为,靠人参与的审核制度必须存在,而且不能偷工减料。

    BBS是一种非常成熟的内容发布机制,几乎所有的BBS都有这样一批人存在——版主/管理员,而一些大型、超大型BBS甚至还设有专门的审贴员,这些人的职责就是一旦发现违规内容,轻则删贴,重则封帐号。

    在新闻站点中,这项工作更加严厉,甚至一篇新闻在发布之前,就要经过层层审批。

    但在Blog站点中,这一工作就逊色的多。这其中主要的原因在于,BBS和新闻都是以内容为导向的,也就是说,不管是谁发布的内容,都会集中在一个区域中体现,这个区域中放置着所有相关的内容;而Blog则是以用户为导向的,用户发表的内容,都集中在自己的一个区域中存放,除非站点提供某种机制,将类似的内容划分到一起。

    因此,针对Blog进行审核试比较麻烦的——1 管理员/审贴员不可能每天浏览每一个用户的blog,对新发布内容进行审核;2 如果将所有人新发布的内容罗列在一个后台页面中等待审核,又很难对内容进行有效的划分,从而将审核工作分配给不同的人去完成。

    另外,随着Web2.0概念的逐渐明晰,“全民参与”的精神逐渐普及,一些Blog站点都提供了“给文章打分”、“将文章推举到首页”或“举报该文章”等功能。这里的“举报”很有用,但是,1 需要避免恶意举报,即便一篇文章遭到举报,也应该在管理员审阅后再决定是否删除;2 总有漏网之鱼,虽然其内容是“不文明”的,但代表了绝大多数群众的看法,因此得不到举报(在高歌主旋律的和谐社会里,作为管理者,还是封杀掉这类内容比较好,嘿嘿)。

    面对这种情况,Anders Liu也很头痛。不过好在,现在绝大多数Blog站点都提供了“标签”。这样的话,可以针对用户提供的标签对内容进行划分,然后由不同的人员完成审批。当然,如果一篇文章提供了多个标签后,很可能导致一篇文章需要经过多人审核;不过没有关系,文章是先发布出去的,然后进行审核(像绝大多数论坛一样),不会影响“文明”内容的时效性,同时,一旦多个审核员中的任何一个删除了该文章,那么就认为该文章未通过审核。

    同时,举报制度依然存在,被举报的文章也会根据其标签,投递到相应的审贴员名下,由审贴员决定是否真的删除。

    这里还存在一些问题,就是如何面对逐渐膨胀的标签列表?如果用户不填写标签怎么办?
    ……呵呵,路漫漫其修远兮,Anders Liu将上下而求索。
    -- End: Thinking Section --

    现在公布答案:
    1 “在没有你的子里”;逃避方法:曰(注意,Y胖了)、R、Ri。(如果扩充关键字列表,把曰和R都加进去,呵呵,结果是,人们看了屏蔽后的言语,不难联想到“子曾经日过”,不文明呀不文明;还有,你知道什么是“*o*”吗?

    2 “微软的这项技术极大便利了开发者的工作”;逃避方法:大.便(注意这一砣把把中有杂质)、Shi.t。

    3 “把Virtual Server当作一台独立的服务器”;逃避方法,嗯,太敏感了,不要逃避,删就删了吧……

    亲爱的朋友们,你有还有遇到什么类似的“不文明”内容吗?或者你对关键字屏蔽有什么其它看法?或有什么解决方案?
     

    发表于 @ 2007年03月25日 13:05:00|评论(loading...)|编辑

    新一篇: 盗版不是这样打的 | 旧一篇: [召集] 关于名词复数形式的翻译

    评论:没有评论。

    发表评论  


    当前用户设置只有注册用户才能发表评论。如果你没有登录,请点击登录
    Csdn Blog version 3.1a
    Copyright © Anders Liu