机器学习与数据挖掘
学习笔记:)
小唐要努力
这个作者很懒,什么都没留下…
展开
-
机器学习——朴素贝叶斯算法(转载自知乎)
本文仅用于学习交流,原文链接https://zhuanlan.zhihu.com/p/26262151如有侵权请联系删除~贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。这篇文章我尽可能用直白的话语总结一下我们学习会上讲到的朴素贝叶斯分类算法,希望有利于他人理解。分类问题综述对于分类问题,其实谁都不会陌生,日常生活中我们每天都进行着分类过程。例如,当你看到一个人,你的脑子下意识判断...转载 2020-11-21 15:16:12 · 948 阅读 · 0 评论 -
机器学习与数据挖掘学习笔记(5)关联挖掘
一、关联挖掘的定义关联挖掘定义为根据事务中其他项的出现情况预测其他项出现的概率。其输入一般为:(1)事务数据库(2)支持度、置信度输出为:所有表示共同出现项的规则。二、关联规则2.1规则的定义如下表达式X->Y,X、Y是项集(itemsets)。如下图事务数据库:则关联规则为:{Milk,Diaper}->{Beer}。2.2评估规则的度量支持度(s):事务中包含X和Y的比率。 置信度(c):Y出现在包含X的事务中的比率。对于...原创 2020-11-09 18:50:52 · 1324 阅读 · 0 评论 -
机器学习与数据挖掘学习笔记(4)异常分析
一、异常的定义异常是在数据集中偏离大部分数据的样本,使人怀疑这些样本的偏离并非由随机因素产生,而是产生于完全不同的机制。异常数据在大多数领域中都当做是噪音去除或者忽略了,但是在某些领域比如网络安全,异常数据的产生往往标志着网络安全的漏洞产生。那么对数据进行分析得到异常数据就可以帮助我们去分析一些犯罪行为,比如电信、保险以及银行领域等等。二、异常挖掘异常挖掘为给定N个数据对象和期望的异常数据个数,通过数据分析的方法发现与其他数据不一致的异常数据。异常挖掘问题主要由两个子问题构成:.原创 2020-11-02 20:33:02 · 908 阅读 · 0 评论 -
机器学习与数据挖掘学习笔记(3)聚类
一、聚类的定义聚类就是将大量未知标注的数据集按照数据本身的特点将数据集划分为多个类别,使得类内的样本尽可能地相似,类间地样本尽可能地不同。之前我们学习过的分类和回归问题都是有监督问题,给的训练集都是有标记的样本;而聚类问题则是无监督问题,训练集的样本都是无标记的。...原创 2020-10-30 16:02:17 · 1032 阅读 · 0 评论 -
机器学习与数据挖掘学习笔记(2)回归
回归分析和分类问题非常相似,不同的是分类问题得到的结果是离散化的,不是属于这个类就是那个类,不会有处于中间的情况,而回归分析最后得到的结果往往是一个具体的数值,即连续的一个结果。回归分析的基本过程也是分为:训练、测试和工作三个阶段...原创 2020-10-28 16:24:31 · 293 阅读 · 0 评论 -
机器学习与数据挖掘学习笔记(1)分类
数据挖掘即研究如何从大量数据或者数据库中提取有用信息。而机器学习则是数据挖掘的一种方法,是研究计算机如何模仿人类的思维方式进行学习。一个非常有名的例子详细大家都听说过,就是沃尔玛在分析研究人们购物留下的账单时发现很多购买了尿布的账单上会同时出现啤酒这个商品,通过调查得知原来很多奶爸在下班后收到家里妻子的请求希望给孩子买一些尿布,在给孩子买尿布的同时往往会顺带买一些啤酒,于是沃尔玛利用“啤酒和尿布”的效应,将二者的货架摆放在一起并且捆绑打折出售,结果二者的销量大增。这就是一个非常典型的从海量数据中原创 2020-10-25 16:02:58 · 1026 阅读 · 0 评论