目前万维网信息产生过程中所涉及信息本身、网站和用户三个方面信息可信度的研究现状。
面向信息本身的信息可信度
信息本身的可信度问题主要是从信息自身出发,根据其内容特征、相互之间的关联关系来研究信息的可信度。目前这方面的研究包括如下两个方面:
基于内容分析的可信度 本质是用信息本身的特征作为评价信息质量和可信度的标准。通常,基于内容分析的可信度计算方法主要包括两种:(1)基于拼写错误的评价方法。基本思想是使用文章中的拼写错误率作为评价这篇文章的数据质量和可信度的标准,认为网页中单词的拼写错误率与信息的质量是正相关的。这种评价方法的应用范围很广,因为它利用信息的文本特性来进行可信度及质量的评价,可以用于判断几乎任何网页的信息质量;(2)基于关键特性量化的评价方法。认为关键的信息特性对信息的质量、价值和可信度评价有至关重要的作用,因此根据某一类具体的应用场景,通过对信息的几个基本特性的分析,将信息的可信度用量化的数值表示,进而计算出一篇文章(一个文档或一个网站)的信息可信度。从实际应用场景中抽象出数学模型是这一类方法的基本思路。