![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习及数据挖掘
文章平均质量分 59
W.J.Z
这个作者很懒,什么都没留下…
展开
-
机器学习:模型估计与选择(一)
1:提出问题学习器在训练集上的误差成为“训练误差”或“经验误差”,在新样本上的误差成为“泛化误差”,显然我们希望得到泛化误差小的学习器,然而,我们并不知道新样本,实际能做的是努力是经验误差最小化,但实际情况下,训练误差很小、在训练集上表现很好的学习器,未必在新样本上表现好,一般无法避免过度拟合现象。那么问题来了:我们无法直接获得泛化误差,而训练误差又由于过度拟合现象的存在不适合作为标准,那么在...原创 2018-10-07 09:09:33 · 352 阅读 · 0 评论 -
线性降维和PCA
原创 2019-04-17 15:03:45 · 534 阅读 · 0 评论 -
统计学习方法总结
简要介绍了感知机、K近邻法、朴素贝叶斯法、决策树、逻辑斯蒂回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型9种统计学习方法的特点。...原创 2019-03-22 21:38:52 · 268 阅读 · 0 评论 -
隐马尔可夫模型
原创 2019-03-21 19:46:49 · 287 阅读 · 0 评论 -
拉格朗日对偶性
原创 2019-03-13 12:42:36 · 305 阅读 · 0 评论 -
EM算法
原创 2019-03-20 12:59:15 · 244 阅读 · 0 评论 -
AdaBoost&提升树
原创 2019-03-19 15:05:10 · 351 阅读 · 0 评论 -
支持向量机
原创 2019-03-14 19:39:12 · 316 阅读 · 0 评论 -
无约束最优化问题求解方法
原创 2019-03-09 16:16:49 · 3915 阅读 · 0 评论 -
逻辑斯蒂回归与最大熵模型
原创 2019-03-08 16:14:22 · 343 阅读 · 0 评论 -
感知机
原创 2019-02-25 20:34:24 · 1952 阅读 · 0 评论 -
朴素贝叶斯
原创 2019-03-01 13:38:17 · 1967 阅读 · 0 评论 -
K近邻模型
k近邻假设给给定一个训练数据集,数据集类别已确定,对于新的实例,根据其k个最近邻训练实例的类别,通过多数表决策等方式进行预测。原创 2019-02-28 12:36:29 · 2310 阅读 · 0 评论 -
latex论文写作简单入门
原创 2019-02-23 17:25:48 · 2282 阅读 · 0 评论 -
matlab:熵值法确定权重
前言课题的模型需要给数据的各个属性进行分配权重,原本想使用AHP层次分析法求每个属性的权重,但因为这个算法主观因素偏重,而且我有用大量的数据,完全可以从数据中学习,最终选择了信息熵确定权重的方法。信息熵为什么能确定权值?信息熵是对信息不确定的一种度量,不确定性越大,信息熵越大,不确定性越小,信息熵越小,因此可以用熵值来确定一个指标的离散程度,离散程度越大,对综合评价的影响越大,其熵值...原创 2018-12-17 15:55:28 · 18347 阅读 · 8 评论 -
ID3决策树代码详解(weka平台)
1 ID3算法流程理论知识不必多讲,下面讲解ID3算法的工作流程,以西瓜书为例: 2 算法代码讲解 2.1 前提必知 2.2 算法流程 3:代码整个算法实际就 makeTree和distributionForInstance两个函数,下面把代码附上来,想要执行的话请下在weka平台,里面包含依赖的类。package weka.classifiers.trees;/...原创 2018-11-09 13:30:56 · 3446 阅读 · 2 评论 -
最简单的贝叶斯网络构建示例
如下图所示,贝叶斯网络结构有四个节点,并且每个节点的概率已经给出,下面将使用mtaltb代码进行该贝叶斯网络的构建并讲解每一行代码的意思,帮助零基础读者快速入门。1:使用矩阵表示该图结构N = 4 ; // 代表图中有四个节点dag = zeros(N,N); // 创建4X4矩阵,用来表示图的连通情况,可看数据结构有向图表示的相关内容C=1;S=2;R=3;W=4; //指定节点...原创 2018-10-10 11:57:51 · 12077 阅读 · 6 评论 -
机器学习:模型估计与选择(二)
4: 比较检验有了实验评估方法和性能度量,是直接取的性能度量的值然后比较大小吗?实际上,机器学习中性能比较这件事要复杂的多,原因有三:我们能获取的是测试性能,而我们想要的是泛化性能;测试集性能和选择的测试集有很大的关系,不同的测试集会导致不同的结果;机器学习算法本身有一定的随机性;我们一般使用统计假设检验来进行学习器性能比较。 4.1 :t 检验假设我们通过重复留出发或交叉验证法等进...原创 2018-10-07 15:53:27 · 295 阅读 · 0 评论 -
matlab实现FCM算法
% author:wangjunzuo% date:2019/5/21% fuction:fcm algrithmnload data load labelmaxgen = 100; %??????m = 2; %2??threshold = 10e-1000; %?????cluster_n = 3; %????%%%%%%%%%...原创 2019-05-23 21:15:04 · 4155 阅读 · 7 评论