机器学习
聆听--风雨
这个作者很懒,什么都没留下…
展开
-
机器学习笔记(一) 基本名词
监督学习的代表:分类和回归无监督学习:聚类训练误差(经验误差):在训练样本集上的误差泛化误差:在测试样本集上的误差模型评估的方法:留出法,交叉验证法,自助法查准率(precision)查全率(recall)真正例(true positive ) 假正例(false positive) 真反例(true negative) 假反例(false negative)查准率原创 2017-03-11 21:39:18 · 594 阅读 · 0 评论 -
机器学习笔记(四)聚类
聚类的目标是簇内相似度尽量大,簇间相似度尽量小。聚类性能度量:外部指标:与参考模型进行比较,常见有JC系数,FM指数,Rand指数内部指标:DB指数,Dunn指数。距离计算:闵可夫斯基距离,当p=2时为欧式距离,当p=1时为曼哈顿距离。用作有序属性。 VDM距离用作无序属性。之后再更原创 2017-03-22 22:09:15 · 2084 阅读 · 0 评论 -
机器学习笔记(六)贝叶斯分类器
一、贝叶斯决策论1.贝叶斯决策准则:要使总体风险最小化,只需要在每个样本上条件风险最小化就行了。h*就是贝叶斯分类器。2.若目标是最小化分类错误率,那么入ij=ci==cj?1:0;也就是R(ci|x)=1-P(ci|x)此事目标转换为最大化p(ci|x)之后再更。。。原创 2017-04-08 11:27:26 · 1283 阅读 · 0 评论 -
机器学习笔记(二) 线性模型
1.基本概念正定矩阵:设M是n阶方阵,如果对任何非零向量z,都有zTMz> 0,其中zT 表示z的转置,就称M正定矩阵对数几率函数(logistic function),替代单位阶跃函数,是一种Sigmoid函数,对应的模型是对数几率回归模型,但实际上是一种分类方法极大似然估计的计算:(1)写出似然函数。(2)求对数并整理。(3)求偏导。(4)求解方程2.线性回归3原创 2017-03-11 21:48:27 · 729 阅读 · 0 评论 -
机器学习笔记(五) 神经网络
一、M-P神经元模型神经元接收来自其他n个神经元的输入,每个输入都有一个权值,神经元再将所有输入的总和与阈值相比较,最终通过激活函数处理来产生神经元的输出。理想的激活函数是阶跃函数(sgn(x)),但是阶跃函数不连续不光滑,所以实际常常应用sigmoid函数作为激活函数。二、感知机与原创 2017-03-31 11:14:51 · 1003 阅读 · 0 评论 -
机器学习笔记(三) 决策树
1.算法流程给定样本集D((x1,y1),(x2,y2)......(xn,yn)),和属性A{a1,a2,....an}(1)若当前节点样本全部为同一类C,则将当前节点设为叶结点,并将其结点的类别设为C。(2)若当前结点,属性集A为空,或者样本在属性集A上的取值相同,则将当前结点设为叶结点,并将其结点的类别设为D中数目最多的类。(3)若当前结点的样本集为空,则把父节点的类别作为当原创 2017-03-26 15:53:58 · 1506 阅读 · 0 评论