Web
使用挖掘是数据挖掘技术的一种应用,是为了理解和更好的为web应用程序服务而从web数据中发现使用模式的一种应用。Web使用挖掘主要包含三个阶段:预处理,模型发现和模式分析。本文详细描述了这三个阶段。因其巨大的应用潜能,各研究机构及其他团体已经对web使用挖掘的兴趣不断攀升。
1. 介绍
在web上执行业务流程易用性和快速性是电子商务迅速增长的关键驱动力量。而且电子商务也把最终用户卷入了一场深重的革命中。跟踪用户浏览行为甚至个体鼠标点击的能力将商家和最终用户前所未有的拉近了。现在对商家来说,针对大量的客户订制行为对每个顾客提供个性化的产品信息是可以实现的。
上面所说的是web 使用挖掘的一个可能的应用场景,是基于应用型数据的挖掘技术到基于web数据的使用模型发现的一个处理过程。与web相关的数据挖掘就称之为web挖掘,广义上可以分为三类,内容挖掘,用途挖掘,结构挖掘。Web内容挖掘和结构挖掘不在文章范围之内。
2. WEB 数据
数据库知识发现一个关键步骤是创建一个合适的目标数据集。在Web挖掘中,数据可以从服务器,客户端,代理服务器或者某个组织的数据库(包含业务数据和整理过的Web数据)中收集。数据采集的每个步骤都与从本地数据源采集都有所不同,比如数据的可用性,数据的分块,实现的方法等。
在web挖掘中有以下几类数据可以使用: