![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机算法与概念
对半独白
笔记是积淀的一种途径。
展开
-
如何直观理解AUC评价指标?
最近一直在思考如何直观理解AUC,查了维基百科的以及网上的讲解描述,感觉仍然很难把这个概念表述得通俗易懂,直到昨天周会后拿笔在纸上画了画,感觉似乎找到了一种比较有意思的理解方法,下面就请各位看官容我慢慢道来。原创 2016-10-29 17:40:57 · 72673 阅读 · 14 评论 -
ks:能定阈值的评价指标
导语之前讲解过AUC评价指标,AUC能很好描述模型整体性能的高低。除了AUC,还有一个指标能描述相同的效果,那便是KS,而且KS还能够给出最佳划分阈值。那么,KS具体是什么指标?计算方式和AUC有何不同?KS评价指标KS(Kolmogorov-Smirnov)评价指标,通过衡量好坏样本累计分部之间的差值,来评估模型的风险区分能力。其计算方式和AUC的计算方式基本类似,我们不妨先来回顾一...原创 2018-06-24 15:24:39 · 16027 阅读 · 2 评论 -
样本不均衡问题调研
● 每周一言。导语在有监督的模型训练中,多多少少都会遇到样本不均衡(Imbalanced Data)的问题,样本不均衡将导致模型学习不到想学到的知识。比如癌症预测模型,相比健康人而言,患癌病人的数量本来就很少,这样数据不平衡的问题很大程度上限制了模型的能力。那么,如何解决样本的不均衡呢?样本不均衡样本不均衡简而言之,就是不同类别标签的样本之间的数量差别较大。由于多分类问题可以转...原创 2018-05-20 16:54:34 · 2481 阅读 · 0 评论 -
什么是管道?
● 每周一言如果有不一样,就努力不让它一样。导语一说到管道,我们可能想到的是超级玛丽的下水道,亦或是曾经流行一时的小游戏flappy bird。而这里要讲的是计算机中的管道,确切的说是linux操作系统中的管道。那么,linux中的管道是什么?有什么作用?管道对于从事互联网行业的人来说,管道技术几乎每天都会用到。在计算机世界中,由于进程之间相互独立,信息无法交互。而计算机中原创 2018-01-28 14:36:48 · 16055 阅读 · 3 评论 -
A Brief Introduction of Deep Learning
导语前面已经讲了一些机器学习的相关概念与理解方式,而现在只要提到机器学习,则不得不提深度学习。作为机器学习的一个重要分支,在硬件计算能力日益发达的今天,深度学习日益受到重视,变得广为人知。那么深度学习到底是什么?本文将通过一篇英文讲稿,给大家揭开深度学习的神秘面纱,为之后讲CNN作好铺垫。原创 2016-11-27 20:13:02 · 1977 阅读 · 0 评论 -
正则项:把控拟合方向的马车夫
导语在模型训练过程中,我们通常会遇到过拟合与欠拟合问题。其中欠拟合是指模型未考虑足够的样本信息而无法对真实情况精确建模的现象。比如一个小孩第一次见到天鹅后认为鸭子也是天鹅。反之,过拟合指的则是模型过度考虑了样本信息而无法对真实情况精确建模的现象。原创 2016-11-20 16:38:19 · 791 阅读 · 0 评论 -
ReLU激活函数:简单之美
导语在深度神经网络中,通常使用一种叫修正线性单元(Rectified linear unit,ReLU)作为神经元的激活函数。原创 2016-11-13 17:46:24 · 143411 阅读 · 13 评论 -
如何直观理解交叉熵及其优势?
在统计学中,损失函数是一种衡量系统错误程度的函数。而在有监督学习模型里,损失函数则是衡量模型对样本预测值与样本真实标签之间差异程度的方法。最近用到了交叉熵,觉得有必要弄明白交叉熵到底是什么原理及优势,因此查了查资料,并结合个人理解在这里做一下讲解,如有疏漏谬误之处还请各位看官多多指教。在这之前,先讲讲交叉熵是什么。原创 2016-11-06 12:12:40 · 12828 阅读 · 1 评论 -
特征选择:最合适的往往就在身边
● 每周一言。导语特征工程,是机器学习过程中必不可少的重要一环。在诸如kagglers、kddcup以及国内的天池大数据竞赛等比赛中,top的优胜队伍通常并不是使用了什么高深的算法,而是在特征工程环节做好了充分的准备,仅使用常见的模型便取得了较为出色的效果。由此可见,特征工程在实际的实验研究以及项目落地过程中,占据着举足轻重的地位。而在特征工程里,特征选择又是其举足轻重的一个环节,...原创 2018-07-01 17:07:47 · 492 阅读 · 0 评论