- 博客(5)
- 资源 (3)
- 收藏
- 关注
原创 Decision Tree
①Aggregation Model 回顾上一篇文章讲到的聚合模型,三个臭皮匠顶一个诸葛亮。于是出现了blending,bagging,boost,stacking。blending有uniform和non-uniform,stacking是属于条件类的,而boost里面的Adaboost是边学习边做linear,bagging也是属于边学习边做unifo...
2018-06-29 23:56:00 147
原创 Aggregation Model : Blending , Bagging , Boosting
⑴Motivation of Aggregation 比如现在有一支股票,你不知道是跌还是涨。你有T个friends,每一个friend对应的建议分别是g1,g2,g3...gn,那么你应该怎么选择建议? ⑵Blending 1.Select the most trust-worthy friend 这其实就是对应validation,我们在所有的frie...
2018-06-26 01:29:00 458
原创 ClusterAlgorithm
聚类算法: 聚类算法属于无监督学习,没有给出分类,通过相似度得到种类。 主要会讲四种:Kmeans均值,层次聚类,DBSCAN,谱聚类。 再讲算法前先讲一下几种衡量相似度的方法: 1.欧氏距离: p=2时就说平时计算的几何距离,当p趋向于正无穷的时候,其实求的就不是x,y的距离了,而是求x y中最长的一个了。因为如果x大于y,在指数增长下x回...
2018-06-19 23:02:00 463
原创 机器学习可行性与VC dimension
机器学习可行性 在银行评估贷款申请人的授信请求前,会进行风险评估。符合申请则通过,反之驳回。长时间的数据和申请使得银行从中找到了一些规律并开始learning,所以风险评估就是一个learning的过程,流程图如下: 机器学习流程图 首先target function我们是未知的,需要求解的。D就是我们的训练数据,hypothesis set...
2018-06-19 19:31:00 337
原创 支持向量机(Support Vector Machine)
支持向量机 linear regression , perceptron learning algorithm , logistics regression都是分类器,我们可以使用这些分类器做线性和非线性的分类,比如下面的一个问题: GV0SHYC3S{P{Q4QVB66UN6T.png 这里的每一条线都是可以把这个平面分开的,支持向量机要做...
2018-06-19 01:32:00 1129
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人