MachineLearning
老肥码码码
Hello World
展开
-
混淆矩阵及其可视化
混淆矩阵(Confusion Matrix)是机器学习中用来总结分类模型预测结果的一个分析表,是模式识别领域中的一种常用的表达形式。它以矩阵的形式描绘样本数据的真实属性和分类预测结果类型之间的关系,是用来评价分类器性能的一种常用方法。我们可以通过一个简单的例子来直观理解混淆矩阵。通过分类模型我们得到的预测结果以及真实的属性可以通过列表的形式展现,y_pred=["ant", "ant", "...原创 2020-04-25 12:28:03 · 5706 阅读 · 0 评论 -
李宏毅《机器学习》2020春季课程学习笔记一
笔记摘要本次机器学习课程主要包含如下内容,较之前的课程有部分改变。机器学习就是一个自动找函数的方法。想要找什么样子的函数?回归问题想要找到一个输出是数值的函数分类问题想要找到一个输出分类的选择的函数如何告诉机器你想要找什么样的函数?监督学习(Supervised Learning)用带标签的数据来训练,告诉机器什么是正确的输出。通过loss,机器可以判断函数的好坏,...原创 2020-04-21 10:38:05 · 290 阅读 · 0 评论 -
李宏毅《机器学习》2020春季课程作业
台大李宏毅教授的2020年的机器学习春季课程已经上线。学习一波,走你!光看视频肯定不行, 作业一定要自己动手完成才行。但是作业是发布在google云上的,为方便大家,我这里有完整的作业资源,需要的可以在后台回复 ML获得!...原创 2020-04-17 15:37:00 · 2076 阅读 · 80 评论 -
统计学习方法笔记与习题解答(Chapter8)
文章目录提升方法笔记摘要AdaBoost算法AdaBoost算法的训练误差分析AdaBoost算法的解释前向分步算法提升树提升树模型提升树算法回归问题的提升树算法梯度提升(GBDT)提升方法笔记摘要在PAC(概率近似正确(PAC, Probably approximately correct))学习框架下,一个概念是强可学习的充分必要条件是这个概念是弱可学习的。提升方法的两个问题在...原创 2019-07-22 17:05:22 · 2967 阅读 · 0 评论 -
统计学习方法笔记与习题解答(Chapter7)(二)
文章目录支持向量机SMO算法问题描述KKT 条件算法内容Part IPart II习题解答支持向量机SMO算法问题描述minα 12∑i=1N∑j=1NαiαjyiyjK(xi,xj)−∑i=1Nαis.t. ∑i=1Nαiyi=00⩽αi⩽C,i=1,2,…,N\begin{aligned}\min_\alpha\ &\f...原创 2019-07-08 13:04:41 · 3959 阅读 · 0 评论 -
统计学习方法笔记与习题解答(Chapter7)(一)
文章目录支持向量机笔记摘要函数间隔几何间隔线性可分支持向量机对偶算法线性支持向量机合页损失支持向量机笔记摘要SVM的基本模型是定义在特征空间上的间隔最大的线性分类器线性可分支持向量机和线性支持向量机假设输入空间和特征空间的元素一一对应,并将输入空间中的输入映射为特征空间的特征向量;非线性支持向量机利用一个从输入空间到特征空间的非线性映射将输入映射为特征向量。支持向量机的学习策略就是间隔...原创 2019-06-26 15:58:53 · 504 阅读 · 0 评论 -
统计学习方法笔记与习题解答(Chapter4)
文章目录朴素贝叶斯法笔记摘要贝叶斯定理条件独立假设参数估计极大似然估计贝叶斯估计习题解答朴素贝叶斯法笔记摘要条件概率分布P(X=x∣Y=ck)P(X=x|Y=c_k)P(X=x∣Y=ck)有指数级数量的参数,其实际估计是不可行的指数级数量的参数 K∏j=1nSjK\prod_{j=1}^nS_jK∏j=1nSj,实际估计不可行是实际上没有那么多样本朴素贝叶斯法是基...原创 2019-06-04 11:23:36 · 399 阅读 · 2 评论 -
统计学习方法笔记与习题解答(Chapter3)
文章目录k近邻法学习笔记算法距离度量k值选择分类决策规则kd树k近邻法学习笔记k值的选择、距离度量及分类决策规则是k近邻法的三要素三要素在算法之中完整体现出来:算法输入: T={(x1,y1),(x2,y2),…,(xN,yN)},xi∈X⊆Rn,yi∈Y={c1,c2,…,ck}T=\{(x_1,y_1),(x_2,y_2),\dots,(x_N,y_N)\}, x_i\in ...原创 2019-06-03 09:59:07 · 1046 阅读 · 1 评论 -
统计学习方法笔记与习题解答(Chapter5)
文章目录决策树笔记摘要熵条件熵经验熵, 经验条件熵信息增益信息增益比ID3算法C4.5的生成算法树的剪枝剪枝算法CART最小二乘回归树生成算法CART分类树的生成习题解答决策树笔记摘要决策树可以认为是if-then规则的集合,也可以认为是定义在特征空间上的条件概率分布根据损失函数最小化的原则建立决策树模型决策树的路径或其对应的if-then规则集合具有一个重要性质:互斥且完备决策树的...原创 2019-06-09 16:22:19 · 1283 阅读 · 0 评论 -
统计学习方法笔记与习题解答(Chapter2)
感知机学习笔记感知机是二类分类的线性模型,属于判别模型感知机学习旨在求出将训练数据进行线性划分的分离超平面.是神经网络和支持向量机的基础损失函数选择损失函数的一个自然选择是误分类点的总数,但是,这样的损失函数不是参数w,bw,bw,b的连续可导函数,不易优化损失函数的另一个选择是误分类点到超平面SSS的总距离,这正是感知机所采用的感知机学习的经验风险函数(损失函数...原创 2019-05-27 19:47:18 · 421 阅读 · 0 评论 -
统计学习方法笔记与习题解答(Chapter6)(一)
文章目录逻辑斯谛回归与最大熵模型逻辑斯谛回归模型逻辑斯谛分布二项逻辑斯谛回归模型模型参数估计多项逻辑斯谛回归最大熵模型联合熵条件熵互信息信息增益相对熵 (KL 散度)最大熵模型的学习逻辑斯谛回归与最大熵模型logistic regression是统计学习中的经典分类方法。最大熵是概率模型学习的一个准则,推广到分类问题得到最大熵模型(maxium entropy model)这两种模型都属于...原创 2019-05-25 20:25:17 · 695 阅读 · 0 评论 -
统计学习方法笔记与习题解答(Chapter1)
笔记摘要统计学习或机器学习一般包括监督学习、无监督学习、强化学习,有时还包括半监督学习、主动学习监督学习监督学习指从标注数据中学习预测模型的机器学习问题,其本质是学习输入到输出的映射的统计规律。输入变量XXX和输出变量YYY有不同的类型,可以是连续或是离散的。根据输入输出变量的不同类型,对预测任务给予不同的名称:输入与输出均为连续变量的预测问题称为回归问题;输出变量为有限个离散变量的...原创 2019-05-24 14:14:02 · 746 阅读 · 2 评论 -
AlexNet论文学习总结
Alex等人在2012年提出的AlexNet网络结构模型在ILSVRC-2012上以巨大的优势获得第一名,引爆了神经网络的应用热潮,使得卷积神经网络CNN成为在图像分类上的核心算法模型。本篇论文阐述了一个多层卷积网络,目标是将120万高分辨率的图像分成1000类。Net StructureAlexNet首先用一张227×227×3的图片作为输入,实际上原文中使用的图像是224×224×3,但...原创 2019-05-18 22:45:40 · 768 阅读 · 0 评论 -
深度学习笔记
神经网络激活函数输出层损失函数梯度下降反向传播参数更新原创 2019-04-22 21:37:01 · 707 阅读 · 0 评论 -
机器学习评价
数据挖掘、机器学习和推荐系统中的评测指标—准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F值(F-Measure)混淆矩阵True Positive(真正,TP):将正类预测为正类数True Negative(真负,TN):将负类预测为负类数False Positive(假正,FP):将负类预测为正类数为误报 (Type I error)...原创 2019-03-11 11:08:45 · 298 阅读 · 0 评论