中国科学院声学研究所的科学家们研发出一种具有语义理解特点的“网络不良信息检测系统”,将帮助政府监管部门和网站管理者监控色情和低俗等不良信息.声学所的“概念层次网络(HNC)”课题组于去年12月创立了这一系统.不同于以往的基于关键字词的检测系统,该软件能够以句、段落为基础进行检索,并对不能作出判断的内容提出警告,供人工判别.
在中国政府开展整治互联网低俗之风专项行动之际,中国科学院声学研究所的科学家们研发出一种具有语义理解特点的“网络不良信息检测系统”,将帮助政府监管部门和网站管理者监控色情和低俗等不良信息.声学所的“概念层次网络(HNC)”课题组于去年12月创立了这一系统.不同于以往的基于关键字词的检测系统,该软件能够以句、段落为基础进行检索,并对不能作出判断的内容提出警告,供人工判别.
据该项目的首席科学家、声学所研究员张全向介绍,用户在软件上输入目标网站的网址,软件便会自动打开该网站上的所有网页,同时检查是否含有不良信息内容.
“它的工作原理有点像搜索引擎,但它更先进的地方在于能够自动辨别不良信息内容,并大大地提高网页的处理数量,减少人工干预的次数.”张全说.
为了提供检测标准,该团队还设立了一个“语料”资料库,即搜集不良信息相关的内容,“储备”在资料库里,并将其转换为计算机语言,这样就为软件搜索不良信息提供了文字基础.
张全说,该软件目前已进入试用阶段,进一步的商业化推广还在计划中.“它可以为政府监管部门和网站管理者提供有效的技术手段,从源头上遏制不良信息传播,净化网络环境.”
但张全同时也指出,对于色情图片、视频等不良影像内容的检测,由于存在很大的技术难度,科学家们目前还没有突破这个瓶颈.
1月初,包括国务院信息办、公安部、文化部在内的国家七大部委联合开展整治互联网低俗之风专项行动,截至2月10日,已关闭严重违法违规网站1911家.
中国社科院新闻与传播研究所研究员闵大洪指出,“政府打击互联网低俗之风的行动为青少年创造了一个相对健康的网络环境,功在当代,利在千秋”.
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/20825327/viewspace-1017455/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/20825327/viewspace-1017455/