数据挖掘原理与算法_15年数据开发大牛总结出的大数据挖掘:概念、模型、方法和算法...

前言

本书主要阐述数据挖掘原理,在示例的引导下详细讲解起源于统计学、机器学习、神经网络、模料逻辑和演化计算等学科的具有代表性的、最前沿的挖掘方法和算法。本书还着重描述如何恰当地选择方法数据分析软件并合理地调整参数。每章末尾附有复习题。

02fb72cd0cffdfc377b89e729684805e.png

本书特点

1.介绍支持向量机(SVM)和Kohonen映射

2.讲解DBSCAN、BIRCH和分布式DBSCAN聚类算法

3.介绍贝叶斯网络,讨论图形中的Betweeness和Centrality参数测量算法

4.分析在建立决策树时使用的CART算法和基尼指数

5.介绍Bagging & Boosting集成学习方法,并详述AdaBoost算法

6.讨论Relief以及PageRank算法

7.讨论文本挖掘的潜在语义分析(LSA),并分析如何测定文本文档之间的语义相似性

8.讲解时态、空间、Web、文本、并行和分布式数据挖掘等新主题

9.更详细地讲解数据挖掘技术商业、隐私、安全和法律方面的内容

4767c01f6f014b092fae0af9ef42fff4.png

第一章 数据挖掘的概念

1.1 概述

1.2 数据挖掘的起源

d9d7bbb98932123bc8188a50a627ce48.png

1.3 数据挖掘过程

5a7df80fb682792da7014b08be007a16.png
1.4 大型数据集
1.5 数据仓库
1.6 数据挖掘的商业方面:为什么数据挖掘项目会失败.
1.7 本书结构安排.
1.8 复习题
1.9 参考书目

第二章 数据准备

2.1 原始数据的表述
2.2 原始数据的特性
2.3 原始数据的转换
2.3.1 标准化
2.3.2 数据平整
2.3.3 差值和比率
2.4 丢失数据
2.5 时间相关数据
2.6 异常点分析
2.7 复习题
2.8 参考书目

第三章 数据归约

3.1 大型数据集的维度
3.2 特征归约
3.2.1 特征选择
3.2.2 特征提取
3.3 Relief算法
3.4 特征排列的熵度量.
3.5 主成分分析
3.6 值归约
3.7 特征离散化:ChiMerge技术
3.8 案例归约
3.9 复习题
3.10 参考书目

第四章 从数据中学习

4.1 学习机器
4.2 统计学习原理
4.3 学习方法的类型
4.4 常见的学习任务
4.5 支持向量机.
4.6k NN:最近邻分类器.
4.7 模型选择 与泛化
4.8 模型的评估
4.9 90%准确的情形
4.9.1 保险欺诈检测
4.9.2 改进心脏护理
4.10 复习题
4.11 参考书目

第五章 统计方法

5.1 统计推断
5.2 评测数据集的差异
5.3 贝叶斯定理
5.4 预测回归
5.5 方差分析
5.6 对数回归
5.7 对数-线性模型.
5.8 线性判别分析
5.9 复习题
5.10 参考书目

第六章 决策树和决策规则

6.1 决策树
6.2 C4.5算法:生成决策树
6.3 未知属性值
6.4 修剪决策树
6.5 C4.5 算法:生成决策规则
6.6 CART 算法和Gini指标
6.7 决策树和决策规则的局限性
6.8 复习题
6.9 参考书 目

第七章人工神经网络

第八章 集成学习

第九章 聚类分析

第十章 关联规则

第十一章 Web 挖掘和文本挖掘

第十二章 数据挖掘高级技术

第十三章 遗传算法

第十四章 模糊集和模糊逻辑

第十五章 可视化方法

附录A数据挖掘工具

附录B数据挖掘应用

6a8656df80a509fce84a78a018e9c187.png

3be3e6a9b4208b4c2fb0ee56d901792f.png

2557d429475a50b0c543973a752f319f.png

总结

由于这本书的细节分的太多了,今天小编就整理到这里想要获取的小伙伴可以+WX15931086386来获取哦~~~

最后给小编一个关注就是最大的动力

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
系统化地阐述了数据挖掘和知识发现技术的产生、发展、应用和相关概念原理算法。对数据挖掘中的主要技术分支,包括关联规则、分类、聚类、序列、空间以及Web挖掘等进行了理论剖析和算法描述。本书的许多工作是作者们在攻读博士学位期间的工作总结,一方面,对于相关概念和技术的阐述尽量先从理论分析入手,在此基础上进行技术归纳。另一方面,为了保证技术的系统性,所有的挖掘模型算法描述都在统一的技术归纳框架下进行。同时,为了避免抽象算法描述给读者带来的理解困难,本书的所有典型算法都通过具体跟踪执行实例来进一步说明。本书共分8章,各章相对独立成篇,以利于读者选择性学习。在每章后面都设置专门一节来对本章内容和文献引用情况进行归纳,它不仅可以帮助读者对相关内容进行整理,而且也起到对本内容相关文献的注释性索引功能。第1章是绪论,系统地介绍了数据挖掘产生的商业和技术背景,从不同侧面剖析了数据挖掘概念和应用价值;第2章给了知识发现的过程分析和应用体系结构设计;第3章对关联规则挖掘的原理算法进行全面阐述;第4章给分类的主要理论和算法描述;第5章讨论聚类的常用技术和算法;第6章对时间序列分析技术和序列挖掘算法进行论述;第7章系统地介绍了Web挖掘的主要研究领域和相关技术及算法;第8章是对空间数据挖掘技术和算法的分析和讲述。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值