机器学习
duncandai
这个作者很懒,什么都没留下…
展开
-
相似度(距离计算)汇总
在数据挖掘中,我们经常需要计算样本之间的相似度(Similarity ),我们通常的做法是计算样本之间的距离,相似性度量用以描述两个向量之间的相似性,看到三篇讲的比较好的关于距离计算的文章,汇总一起方便查阅。转载 2017-10-19 09:44:58 · 13295 阅读 · 0 评论 -
损失函数总结
原创 2018-05-20 15:18:03 · 1105 阅读 · 0 评论 -
激活函数汇总及各优缺点
原创 2018-05-14 11:05:24 · 1482 阅读 · 0 评论 -
保序回归
2015-10-26 20:09:07 · 145 阅读 · 0 评论 -
支持度(support)和置信度(confidence)
如果同时满足最小支持度阈值和最小置信度阈值,则认为关联规则是有趣的。这些阈值由用户或者专家设定。 示例:某销售手机的商场中,70%的手机销售中包含充电器的销售,而在所有交易中56%的销售同时包含手机和充电器。则在此例中,支持度为56%,置信度为70%。原创 2015-04-24 11:01:19 · 1826 阅读 · 0 评论 -
特征工程
1.什么是特征工程 顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。特征工程是指从原始数据转换为特征向量的过程。2.特征工程作用 在业界广泛流传一句话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。(1)特征越好,灵活性越强只要特征选得好,即使是一般的模型(或算法)也能获得很好的性能,因为大多数模型(或...原创 2018-05-30 11:03:11 · 247 阅读 · 0 评论 -
损失函数总结
1.什么是损失函数损失函数(loss function)是用来估量模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型认为性能就越好。2.损失函数,代价函数和目标函数的区别损失函数:计算的是一个样本的误差代价函数:是整个训练集上所有样本误差的平均目标函数:代价函数 + 正则化项目标函数公...原创 2018-05-20 15:18:03 · 469 阅读 · 0 评论 -
激活函数汇总及各优缺点
激活函数1. 什么是激活函数如下图,在神经元中,输入的 inputs 通过加权,求和后,还被作用了一个函数,这个函数就是激活函数 Activation Function。[img]http://dl2.iteye.com/upload/attachment/0129/8036/e5a56dfd-c778-3397-9e24-a786b7d9d7a9.png[/img]...原创 2018-05-14 11:05:24 · 992 阅读 · 0 评论 -
保序回归
保序回归(英文:Isotonic regression)在数值分析中指的是在保序约束下搜索一个加权 w 的最小二乘 y 以拟合变量 x,它是一个二次规划问题 python的实现版本:http://scikit-learn.org/stable/auto_examples/plot_isotonic_regression.html#example-plot-isotonic-reg...2015-10-26 20:09:07 · 375 阅读 · 0 评论 -
支持度(support)和置信度(confidence)
支持度:关联规则在D中的支持度(support)是D中事务包含的百分比,即概率;置信度(confidence):是包含X的事务中同时包含Y的百分比,即条件概率。 如果同时满足最小支持度阈值和最小置信度阈值,则认为关联规则是有趣的。这些阈值由用户或者专家设定。 示例:某销售手机的商场中,70%的手机销售中包含充电器的销售,而在所有交易中56%的销售同时包含手机和充电器。则在...原创 2015-04-24 11:01:19 · 3042 阅读 · 0 评论 -
特征工程
原创 2018-05-30 11:03:11 · 168 阅读 · 0 评论