摘要:
随着互联网的迅速发展,网络信息资源的数量和种类也以惊人的速度增长,互联网作为重要的信息载体已成为最重要的信息传播渠道.随着网络深入全民的日常生活,人们可以利用互联网快速获取和传播各种信息.面对如此海量的数据,如何方便,智能,快捷地从中获取价值的信息为己所用,已成为人们亟待解决的关键问题.因此,对互联网信息采集系统的研究具有重大的现实意义. 本课题针对当前网络资源数量巨大,冗杂,缺乏针对性管理的现状,设计开发互联网信息采集系统,实现对网络资源的实时监控和自动采集.根据服务器的负载能力和网站的更新速度自动调整刷新... 展开 随着互联网的迅速发展,网络信息资源的数量和种类也以惊人的速度增长,互联网作为重要的信息载体已成为最重要的信息传播渠道.随着网络深入全民的日常生活,人们可以利用互联网快速获取和传播各种信息.面对如此海量的数据,如何方便,智能,快捷地从中获取价值的信息为己所用,已成为人们亟待解决的关键问题.因此,对互联网信息采集系统的研究具有重大的现实意义. 本课题针对当前网络资源数量巨大,冗杂,缺乏针对性管理的现状,设计开发互联网信息采集系统,实现对网络资源的实时监控和自动采集.根据服务器的负载能力和网站的更新速度自动调整刷新频率,对监控站点进行增量采集,过滤垃圾信息,及时高效地采集新的网页信息,极大地提高了人们对指定信息获取的准确度和速度,为深入加工和分析互联网信息奠定了坚实的基础.最终方便人们高效地使用这些信息. 本论文以信息采集系统的功能需求为向导,从理论调研,需求分析,系统架构,功能实现等方面入手,详细阐述了本互联网信息采集系统的设计与实现过程.首先对互联网信息采集系统研究的背景,国内外研究现状以及系统设计的目标和意义进行介绍.然后研究分析了系统的采集对象,采集基本原理和系统设计策略.接下来研究分析了系统的功能需求,性能需求,以及系统实现待解决的关键问题.从而对互联网信息采集系统的设计方案(即总体设计方案,详细设计方案)进行介绍.最后对全文进行总结和展望. 收起
展开