![](https://img-blog.csdnimg.cn/20190918140129601.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据挖掘笔记
数据挖掘课程笔记~~~
嘤桃小团子
学生
展开
-
数据挖掘课程笔记--关联分析
一、关联规则简述关联规则是一种在大型数据库中发现事物之间相关性的方法,这里的事物有产品、 事件,比如什么商品会被一起购买。当某件事发生时,其他事件也会发生,这种联系称为关联。所谓关联分析,就是指如果两个事物或者多个事物之间存在-定的关联,那么其中一个事物就能通过其他事物进行预测,它的目的是为了挖掘隐藏在数据间的规律和相关关系,根据 挖掘结果,设计促销组合方案,实现销量的提升。比较常见的场景...原创 2020-04-15 01:10:44 · 6889 阅读 · 1 评论 -
数据挖掘课程笔记--分类(5)人工神经网络
一、神经元模型“神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应”[Kohonen,1988]神经网络中最基本的成分是神经元模型。在生物神经网络中,每个神经元与其他神经元相连,当它“兴奋”时,就会向相连的神经元发送化学物质,从而改变这些神经元内的电位;如果某神经元的电位超过了一个“阈值”(threshold), 那么它就会被激...原创 2020-04-11 12:42:36 · 832 阅读 · 0 评论 -
数据挖掘课程笔记--分类(4)朴素贝叶斯
零、前言在很多应用中,属性集和类变量之间的关系是不确定的。换句话说,尽管测试记录的属性集和某些训练样例相同,但是也不能正确地预测它的类标号。这种情况产生的原因可能是噪声,或者出现了某些影响分类的因素却没有包含在分析中。例如,考虑根据一个人的饮食和锻炼的频率来预测他是否有患心脏病的危险。尽管大多数饮食健康、经常锻炼身体的人患心脏病的机率较小,但仍有人由于遗传、过量抽烟、酗酒等其他原因而患病。确定...原创 2020-04-09 16:40:28 · 900 阅读 · 1 评论 -
数据挖掘课程笔记--分类(3)最近邻分类
一、最小距离分类在统计模式识别中,可以采用最小距离分类器,它是计算待分类的样本到各个已知类别的中心(通常是训练集中同类样本的重心)的距离,将其划分到据它最近的类别中去,这可以看做是一种最近邻的分类规则。二、最近邻分类器最近邻分类器是在最小距离分类的基础上进行拓展,将训练集中的每一个样本作为判别依据,找出和测试样例属性比较接近的所有训练样例,这些训练样例被称为最近邻,可以用来确定测试样例的类标...原创 2020-04-09 12:36:59 · 2165 阅读 · 0 评论 -
数据挖掘课程笔记--分类(2)基于规则的分类
一、算法简介规则是表示信息或少量知识的好方法。基于规则的分类器使用一组IF—THEN规则进行分类。规则: (Condition) ----->yCondition 是属性测试的合取y 是类标号左部: 规则的前件或前提右部: 规则的结论分类规则的例子:(胎生=否) ^飞行动物=是) -->鸟类(胎生=是) ^ (体温=恒温) --> 哺乳类二 规则的质...原创 2020-04-08 16:15:19 · 3576 阅读 · 0 评论 -
机器学习--分类(1)决策树
一、决策树模型决策树(decision tree)是一种常用的机器学习方法,是一种描述对实例进行分类的树形结构。举例:决策树基于“树”结构进行决策:(1)内部结点:属性(2)分支:属性值(3)p叶结点:分类结果学习过程:通过对训练样本的分析来确定“划分属性”(即内部结点所对应的属性)预测过程:将测试示例从根结点开始,沿着划分属性所构成的“判定测试序列”下行,直到叶结点学习的过程就是...原创 2020-04-07 11:43:38 · 1107 阅读 · 0 评论