一拳超人从不秃头
No_Game_No_Life_
这个作者很懒,什么都没留下…
展开
-
One PUNCH Man——LR逻辑回归
文章目录引言LR介绍引言LR算法可能不像随机森林、SVM、神经网络、GBDT等分类算法那么复杂那么高深的样子,可是绝对不能小看这个算法,因为它有几个优点是那几个算法无法达到的。一是逻辑回归的算法已经比较成熟,预测较为准确;二是模型求出的系数易于理解,便于解释,不属于黑盒模型,尤其在银行业,80%的预测是使用逻辑回归;三是结果是概率值,可以做ranking model;四是训练快。当然它也有...原创 2019-04-29 10:24:41 · 1359 阅读 · 0 评论 -
One PUNCH Man——隐马尔可夫模型(HMM)
文章目录概率图模型简介HMM概率图模型简介概率模型(probabilistic model)提供了一种描述框架,将学习任务归结于计算变量的概率分布。在概率模型中,利用已知变量推测未知变量的分布称为"推断" (inference) ,其核心是如何基于可观测变量推测出未知变量的条件分布。生成式模型:从统计的角度表示数据的分布情况,能够反映同类数据本身的相似度,不关心判别边界。举例:判别式分...原创 2019-05-09 13:18:19 · 761 阅读 · 0 评论 -
One PUNCH Man——半监督学习
文章目录半监督学习介绍半监督SVM基于分歧的方法半监督聚类半监督学习这一块的算法原理,由于有的内容大学数学没学到的缘故,我很多都没看懂,下面只提及一些我看懂的东西。半监督学习介绍我们在丰收的季节来到瓜田,满地都是西瓜,瓜农抱来四个西瓜说这都是好瓜,然后指着地里面六个瓜说这些不好,还需要再生长几天,基于这些信息,我们能否构建一个模型,用于判别地里面哪些是该采摘的瓜?显然,可将瓜农告诉我们的好瓜...原创 2019-05-09 09:46:20 · 822 阅读 · 0 评论 -
One PUNCH Man——支持向量机
文章目录间隔与支持向量对偶问题核函数核函数进阶间隔与支持向量给定训练样本集D={(x1,y1),(x2,y2),⋯,(xm,ym)}D=\{(x_1,y_1),(x_2,y_2),⋯,(x_m,y_m)\}D={(x1,y1),(x2,y2),⋯,(xm,ym)}其中yi∈{−1,+1}y_i∈\{−1,+1\}yi∈{−1,+1},分类学习最基本的想法就是基于训练集D在样本空间...原创 2019-05-06 15:17:57 · 887 阅读 · 0 评论 -
One PUNCH Man——深度学习入门
文章目录人类视觉原理从神经网络到卷积神经网络(CNN)数据输入层卷积计算层卷积的计算参数共享机制激励层池化层全连接层CNN优缺点卷积神经网络的常用框架人类视觉原理深度学习的许多研究成果,离不开对大脑认知原理的研究,尤其是视觉原理的研究。1981 年的诺贝尔医学奖,颁发给了 David Hubel(出生于加拿大的美国神经生物学家) 和TorstenWiesel,以及 Roger Sperry。...原创 2019-05-06 10:37:04 · 1923 阅读 · 0 评论 -
One PUNCH Man——变量显著性检验
文章目录显著性检验简介t检验单侧检验与双侧检验(区别在于是否知道标准)确定P值和做出推断结论T检验例子栗子no.1栗子No.2F检验判断一个变量是否显著,我们一般采用T检验和F检验的方式。显著性检验简介假设检验也叫显著性检验,是以小概率反证法的逻辑推理,判断假设是否成立的统计方法,它首先假设样本对应的总体参数(或分布)与某个已知总体参数(或分布)相同,然后根据统计量的分布规律来分析样本数据,...原创 2019-04-25 15:24:27 · 7755 阅读 · 0 评论 -
One PUNCH Man——线性回归算法
文章目录回归分析的目的线性回归步骤一元线性回归操作和解释回归分析的目的回归分析的目的大致可分为两种:第一,预测。预测目标变量,求解目标变量y和说明变量(x1,x2,…)的方程。y=a0+b1x1+b2x2+…+bkxk+误差y=a_{0}+b_1x_1+b_2x_2+…+b_kx_k+误差y=a0+b1x1+b2x2+…+bkxk+误差把上述方程叫做(多元)回归方程或者(多...原创 2019-04-25 14:50:00 · 1375 阅读 · 0 评论 -
One PUNCH Man——特征选择
文章目录特征选择子集搜索与评价特征选择对于一个学习任务来说,给定属性集,其中有些属性可能很关键,另一些属性则可能没什么用。我们将属性称为“特征”(feature)。对当前学习任务有用的属性称为“相关特征”(relevant feature)。没什么用的属性称为“无关特征”(irrelevant feature)。有一类特征称为"冗余特征" (redundant feature) ,它们所包...原创 2019-05-08 14:19:57 · 663 阅读 · 0 评论 -
One PUNCH Man——降维
文章目录k 近邻(KNN)低维嵌入k 近邻(KNN)KNN是通过测量不同特征值之间的距离进行分类。它的思路是:给定某个测试样本,kNN基于某种距离度量在训练集中找出与其距离最近的k个带有真实标记的训练样本,然后给基于这k个邻居的真实标记来进行预测。如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不大于20的整数。KN...原创 2019-05-08 11:09:56 · 493 阅读 · 0 评论 -
One PUNCH Man——激活函数和梯度消失/爆炸
文章目录什么是激活函数激活函数介绍首先推荐一个写公式的网站:https://www.codecogs.com/latex/eqneditor.php什么是激活函数如下图,在神经元中,输入的 inputs 通过加权,求和后,还被作用了一个函数,这个函数就是激活函数 Activation Function。如果不用激励函数,每一层输出都是上层输入的线性函数,无论神经网络有多少层,输出都是...原创 2019-04-25 11:18:51 · 2023 阅读 · 0 评论 -
One PUNCH Man——交替最小二乘推荐算法
文章目录交替最小二乘推荐算法ALS算法的应用交替最小二乘推荐算法ALS(Alternating Least Square),交替最小二乘法。在机器学习中,特指使用最小二乘法的一种协同推荐算法。如下图所示,u表示用户,v表示商品,用户给商品打分,但是并不是每一个用户都会给每一种商品打分。比如用户u6就没有给商品v3打分,需要我们推断出来,这就是机器学习的任务。注意:虽然这个表在上图看起来...原创 2019-04-24 14:38:26 · 1681 阅读 · 0 评论 -
One PUNCH Man——梯度下降和全局最优
文章目录梯度下降梯度下降算法局部极小值和全局最小值模拟退火随机梯度下降遗传算法梯度下降梯度下降我们前面的介绍,简单的略过了,这里详细解释一下。梯度下降法的基本思想可以类比为一个下山的过程。假设这样一个场景:一个人被困在山上,需要从山上下来(i.e. 找到山的最低点,也就是山谷)。但此时山上的浓雾很大,导致可视度很低。因此,下山的路径就无法确定,他必须利用自己周围的信息去找到下山的路径。这个时...原创 2019-05-05 14:27:03 · 3654 阅读 · 0 评论 -
One PUNCH Man——朴素贝叶斯
文章目录朴素贝叶斯算法介绍朴素贝叶斯定义朴素贝叶斯算法介绍朴素贝叶斯,之所以称为朴素,是因为其中引入了几个假设(不用担心,下文会提及)。而正因为这几个假设的引入,使得模型简单易理解,同时如果训练得当,往往能收获不错的分类效果,因此这个系列以naive bayes开头和大家见面。因为朴素贝叶斯是贝叶斯决策理论的一部分,所以我们先快速了解一下贝叶斯决策理论。假设有一个数据集,由两类组成(简化问...原创 2019-04-29 17:04:02 · 1171 阅读 · 0 评论 -
One PUNCH Man——神经网络
文章目录神经网络简介感知机与多层网络误差逆传播算法(BP)神经网络简介在生物神经网络中1 每个神经元与其他神经元相连,当它"兴奋"时,就会向相连的神经元发送化学物质,从而改变这些神经元内的电位:如果某神经元的电位超过了一个"阈值" (threshold) , 那么它就会被激活, 即"兴奋"起来,向其他神经元发送化学物质。1943 年, [McCulloch and Pitts, 1943] ...原创 2019-05-05 11:24:03 · 1224 阅读 · 0 评论 -
One PUNCH Man——决策树和随机森林
文章目录从LR到决策树决策树介绍“树”的成长过程这颗“树”长到什么时候停“树”怎么长ID3算法C4.5算法CART算法从LR到决策树之前的文章,我们介绍了LR逻辑回归。总结一下LR模型的优缺点:优点适合需要得到一个分类概率的场景。实现效率较高。很好处理线性特征。缺点当特征空间很大时,逻辑回归的性能不是很好。不能很好地处理大量多类特征。对于非线性特征,需要进行转换。决策...原创 2019-04-29 11:03:07 · 1287 阅读 · 0 评论 -
One PUNCH Man——聚类
文章目录聚类介绍性能度量距离计算k-means学习向量量化高斯混合聚类密度聚类层次聚类聚类介绍在"无监督学习" (unsupervised learning) 中,训练样本的标记信息是未知的。目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。此类学习任务中研究最多、应用最广的是"聚类" (clustering).性能度量暂不介绍,概念太多,比较简单。和...原创 2019-05-07 14:09:32 · 707 阅读 · 0 评论