王灿,浙江大学计算机学院硕士研究生,毕业后在浙江大学计算机学院软件研究所任职。多年从事计算机学科的科研及项目的开发工作和教学工作。在浙江大学软件学院英文讲授数据库系统管理与维护课程和数据库程序设计课程。
目前主要的研究方向:
★数据库系统理论
★数据挖掘
★web数据管理
★XML数据库等
-----------------------------------
此数据挖掘PPT是浙江大学电子商务专业中的课程讲稿。
使用的教材是《数据挖掘:概念与技术》 Jiawei Han和Micheline Kamber 著
机械工业出版社(2001)
课程大纲:
一、数据挖掘的概念、现状和趋势
了解数据挖掘的基本概念,掌握数据挖掘系统的基本架构,数据挖掘技术的应用对象,了解数据挖掘的功能,所挖掘的数据模式以及当前数据挖掘中的热点问题。
二、数据仓库和数据挖掘的OLAP技术
了解数据仓库和OLAP技术的基本概念,掌握数据仓库的体系结构,熟悉数据仓库的实现技术,了解数据立方体技术的发展方向。
三、数据预处理
掌握数据预处理的基本概念和意义,熟悉几种数据预处理技术,包括数据清理、数据集成和变换、数据归约以及离散化和概念分层生成
四、数据挖掘原语、语言和系统结构
掌握数据挖掘任务的定义,掌握定义不同数据挖掘任务的数据原语的DMQL句法
五、概念描述:特征化与比较
掌握概念描述的概念和基本方法,掌握数据概化和基于汇总的特征化,了解解析特征化和挖掘类比较
六、挖掘大型数据库中的关联规则
掌握关联规则挖掘的基本概念,掌握由事务数据库挖掘单维布尔关联规则的方法和基本算法,了解由事务数据库挖掘多层关联规则的方法,掌握多维关联规则挖掘的概念和基本方法,掌握由关系数据库和数据仓库挖掘多维关联规则的方法
七、分类和预测
掌握分类和预测的基本概念和相关问题,了解判定树归纳分类,贝叶斯分类,后向传播分类和基于源自关联规则挖掘概念的分类。
八、聚类分析
掌握聚类分析的概念、数据类型和方法分类,熟悉划分方法和层次方法,了解基于密度的方法, 基于网格的方法,基于模型的聚类方法,孤立点分析
九、电子商务与数据挖掘
掌握电子商务中进行数据挖掘的必要性和优势;掌握电子商务网站中可以挖掘的内容;了解基于WEB日志的数据挖掘的步骤和主要方法;了解WEB日志挖掘的局限性;了解电子商务中数据挖掘应用的几种新架构;掌握当前电子商务中进行数据挖掘的主要挑战。
[Last edited by 幻影无痕 on 2006-11-2 at 07:49]