Web数据挖掘小论文

最新推荐文章于 2022-10-08 11:58:43 发布

rencongwhu

最新推荐文章于 2022-10-08 11:58:43 发布

阅读量4.7k

点赞数 1

分类专栏： Thought 文章标签： Web数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rencongwhu/article/details/37056213

版权

本文探讨了Web数据挖掘的重要性和挑战，将其分为内容、结构和使用记录挖掘三类。面对大数据，提出改进策略，如限定抓取范围、减少重复数据、建立学习规则优化爬取，并强调URL链接在提高效率中的作用。Web数据挖掘广泛应用于各个领域，特别是在大数据时代，其价值日益显著。

摘要由CSDN通过智能技术生成

1、目的意义

Web数据挖掘是利用数据挖掘技术从Web文档和Web服务器中发现并提取人们感兴趣的信息或知识的过程。涉及到Internet技术、人工智能、计算机语言学、信息学、统计学等多个领域。

Web包含了丰富和动态的超链接信息，以及Web页面的访问和使用信息，这为数据挖掘提供了丰富的资源。然而，从以下的分析中可以看到，对Web进行有效的知识发现具有极大的挑战性：Web挖掘对象多样性；Web页面的复杂性；Web作为信息源的极强动态性；Web用户群体的广泛性；Web页面的有用价值却极低。随着大数据时代的到来，Web数据挖掘在大数据中的重要地位日益凸显。

2、现状

Web数据挖掘是一个更具挑战性的课题，它实现对Web存取模式、Web结构规则和动态的Web内容的查找。一般地Web挖掘可分为3类：Web内容挖掘、Web结构挖掘和Web使用记录的挖掘。Web数据挖掘通过统计、在线分析处理、情报检索、机器学习、专家系统（依靠过去的经验法则）和模式识别等诸多方法来实现上述目标。大数据技术与传统Web数据挖掘相比，整合了大规模并行处理数据库、数据挖掘网络、分布式文件系统

最低0.47元/天解锁文章

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。