![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器/深度学习
forest小拳拳
这个作者很懒,什么都没留下…
展开
-
机器学习-关于自定义损失函数(tensorflow笔记)
对于回归问题,最常用的损失函数是均方误差(MSE,mean squared error),但是对于实际问题,MSE可能是最接近于真实答案,但却不是能使实际问题利益最大化的选择。比如对于预测商品销量的问题,如果预测多了(预测值大于真实销量),损失的是商品的成本,如果预测少了(预测值小于真实销量),损失的是商品的利润。那有可能多预测一个少挣1元,而少预测一个就可能少挣10元。因此需要将损失函数与利润直...原创 2018-05-21 19:27:28 · 1156 阅读 · 0 评论 -
从Kaggle上Titanic比赛引出的各类分类器模型基本方法(未完)
在Titanic生存预测的例子中,在模型融合之前运用到了多个基分类器模型,对特征进行了筛选。这里大概用到了RandomForest、AdaBoost、ExtraTrees、GBDT、DecisionTree、KNN、SVM 等7个模型,而这些基本模型的运用也是机器学习实战(sklearn库)中最基本的最核心的地方,因此想记录一下各个模型的的一些基本方法。首先给出Titanic实战中的模型运用和结果...原创 2018-07-11 11:08:55 · 713 阅读 · 0 评论 -
hierarchal cluster (层次聚类,single/complete linkage)
看网上似乎没有层次聚类关于single/comlplete linkage只用numpy的轮子,于是根据作业需求造了一个。 虽然都是层次聚类,但是基于single/comlplete linkage的和average linkage的着实不太一样。首先从直观角度来讲,后者每一次合并后都得重新算一次新的簇的中心结点是什么,复杂度非常高。而前者只考虑初始叶结点之间的距离作为最终所有簇间距的评估标准。...原创 2019-04-27 10:19:48 · 1766 阅读 · 0 评论 -
hierarchal cluster (层次聚类,complete linkage)
上一篇博客介绍了single linkage是让所有簇的距离为簇间结点最短的距离,同时每一次合并所有簇间距中最短的那一个。 而complete则是让簇间结点距离最长的作为簇间距,并且每一次让所有簇间距最短两簇进行合并,因此实际上不是都找最长,而是最长最短。 因此对于基于上一篇的实现方式,complete linkage则需要在每一次循环中维护一个存储以簇间最长距离而作为簇间距的字典,同时字典的...原创 2019-05-01 11:51:55 · 3977 阅读 · 0 评论 -
Kaggle比赛----LANL Earthquake Prediction(Baseline)
第一次较完整地kaggle比赛接近尾声,LANL Earthquake Prediction,先做一篇类似于baseline的东西吧,由于自己看为主,所以简单的一些代码不会全部写出来,主要作为一个思路。比赛地址为:https://www.kaggle.com/c/LANL-Earthquake-Prediction 题目介绍: In this competition, you will add...原创 2019-05-31 14:11:25 · 785 阅读 · 0 评论