所谓网页垃圾,就是某些网站,利用搜索引擎的结果排序特点,采用一定的欺骗技术,使其在某些主题上具有较高的权重,当用户搜索这些主题时,这些网站将排在结果序列的前面.从某种角度讲,网页垃圾的出现是互联网发展的一个表现,它反映出互联网在更大的范围内为人们所了解和研究.
对于网页垃圾的学术研究也开始逐步形成规模,在Web spam taxonomy一文中,作者Zolt´an Gy¨ongyi 和Hector Garcia-Molina根据网页垃圾的技术特点进行了比较系统的分析.目前,在互联网上比较流行的网页垃圾主要有网页跳转,关键词堆砌,超链接堆砌,信息隐藏等.作为一个反网页垃圾的工程师,我希望自己转行,让我们投入更多的精力去研究如何更好的发展互联网,而不是和一些网络垃圾较劲.