机器学习
文章平均质量分 79
zk_ken
这个作者很懒,什么都没留下…
展开
-
机器学习模型的评价指标和方法
http://blog.csdn.net/pipisorry/article/details/52574156衡量分类器的好坏对于分类器,或者说分类算法,评价指标主要有accuracy, [precision,recall,宏平均和微平均,F-score,pr曲线],ROC-AUC曲线,gini系数。对于回归分析,主要有mse和r2/拟合优度。分类模型的评估机器学习系统设计系统...转载 2018-08-24 10:32:13 · 13334 阅读 · 1 评论 -
线性插值,双线性插值Bilinear Interpolation算法
参考资料:http://blog.csdn.net/xbinworld https://blog.csdn.net/xbinworld/article/details/65660665转载 2018-11-24 20:16:39 · 651 阅读 · 0 评论 -
机器学习知识点总结
在一个n维的空间中, 最好的检测outlier(离群点)的方法是:马氏距离对数几率回归(logistics regression)和一般回归分析有什么区别?:对数几率回归是设计用来预测事件可能性的 对数几率回归可以用来度量模型拟合程度 对数几率回归可以用来估计回归系数bootstrap数据是什么意思?(提示:考“bootstrap”和“boosting”区别): 有放回...原创 2018-10-12 17:58:21 · 1234 阅读 · 0 评论 -
EM算法推导
参考链接:https://blog.csdn.net/zouxy09/article/details/8537620一、最大似然 扯了太多,得入正题了。假设我们遇到的是下面这样的问题: 假设我们需要调查我们学校的男生和女生的身高分布。你怎么做啊?你说那么多人不可能一个一个去问吧,肯定是抽样了。假设你在校园里随便地活捉了100个男生和100个女生。他们共200个人...转载 2018-09-03 16:15:25 · 1221 阅读 · 1 评论 -
LR与SVM比较
原文:http://blog.sina.com.cn/s/blog_818f5fde0102vvpy.html在大大小小的面试过程中,多次被问及这个问题:“请说一下逻辑回归(LR)和支持向量机(SVM)之间的相同点和不同点”。第一次被问到这个问题的时候,含含糊糊地说了一些,大多不在点子上,后来被问得多了,慢慢也就理解得更清楚了,所以现在整理一下,希望对以后面试机器学习方向的同学有所帮助(至少可...转载 2018-09-05 10:38:25 · 142 阅读 · 0 评论 -
adam算法
Momentum是为了对冲mini-batch带来的抖动。RMSprop是为了对hyper-parameter进行归一,均方根反向传播(RMSProp)。这两个加起来就是Adam看原始的RMSProp算法: 再看算法:其实就是Momentum+RMSProp的结合,然后再修正其偏差。 ...原创 2018-09-05 10:34:22 · 11290 阅读 · 1 评论 -
生成模型和判别模型的区别
来源:https://blog.csdn.net/yaphat/article/details/52574748特点:产生式模型:从统计的角度表示数据的分布情况,能够反映同类数据本身的相似度,不关心判别边界。判别式模型:寻找不同类别之间的最优分类面,反映的是异类数据之间的差异。区别:产生式模型(Generative Model)与判别式模型(Discrimitive Model...转载 2018-09-02 11:09:23 · 348 阅读 · 0 评论 -
逻辑回归问题总结
来源:http://www.cnblogs.com/ModifyRong/p/7739955.html https://www.cnblogs.com/zhizhan/p/5038747.html1.简介 逻辑回归是面试当中非常喜欢问到的一个机器学习算法,因为表面上看逻辑回归形式上很简单,很好掌握,但是一问起来就容易懵逼。所以在面试的时候给大家的第一个建议不要说自己精通逻辑...转载 2018-09-01 10:35:21 · 7042 阅读 · 2 评论 -
机器学习中不平衡数据的处理方式
https://blog.csdn.net/pipisorry/article/details/78091626不平衡数据的场景出现在互联网应用的方方面面,如搜索引擎的点击预测(点击的网页往往占据很小的比例),电子商务领域的商品推荐(推荐的商品被购买的比例很低),信用卡欺诈检测,网络攻击识别等等。问题定义那么什么是不平衡数据呢?顾名思义即我们的数据集样本类别极不均衡,以二分类问题为例,...转载 2018-08-24 10:44:56 · 18017 阅读 · 1 评论 -
使用pip安装第三方库出现的问题
1、如图解决方案:在cmd中输入easy_install pip原创 2019-01-24 17:13:50 · 512 阅读 · 0 评论