自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 机器学习总结----iForest异常值处理

本篇博客参考了iForest主要思想iForest适用于连续数据的异常检测,它将一场定义为“容易被孤立的离群点”,也可以理解为分布稀疏且离密度高的群体较远的点,属于一种无参数无监督的方法。在iforest中,我们不断的用超平面切割空间,知道每个子空间只剩下一个点,那么我们就可以看出,密度高的簇要被切很多次才能将里面的点单独分割出来,而密度低的点,很容易就会被超平面分割到一个单独的空间里。...

2020-04-15 19:20:12 916

原创 机器学习总结----FFM

本片博客参考了:https://blog.csdn.net/hiwallace/article/details/81333604http://www.uml.org.cn/sjjmwj/2016031410.aspFFM(Field-aware Factorization Machine)FFM在FM的基础上引入了field的概念,就是吧相同性质的特征归于同一个field,比如,在职业这个...

2020-04-06 13:42:35 398

原创 机器学习总结----FM因子分解机

本博客参考了https://zhuanlan.zhihu.com/p/37963267https://zhuanlan.zhihu.com/p/58160982FM(Factorization Machine)FM的结构比较简单,考虑到线性模型中加入了特征组合。在世纪的点击率预测项目中,往往有很多类别型特征,而这些特征需要进行one-hot处理,但是经过one-hot处理后的数据特征空间会...

2020-04-05 23:47:00 224

原创 数据结构----字典树(python实现)

之前刷leetcode的时候看到一题用字典树来解决的题leetcode820.觉得这个字典树挺有意思的,记录一下字典树是一颗多叉树,看上图的字典树,每一条路径都能找到一个单词,end=True的地方说明从根节点到该节点这段路也能找到一个单词,上面的这颗字典树可以找到[‘apple’,‘app’,‘bee’,‘bar’,‘car’]中的单词,但是找不到‘ap’这样的字符。那么字典树能干嘛呢...

2020-04-01 16:18:46 417

原创 机器学习总结----融合模型Stacking

本博客参考了:https://blog.csdn.net/maqunfi/article/details/82220115https://zhuanlan.zhihu.com/p/27493821主要思路stacking框架是集成了不同的算法,充分利用不同算法从不同的数据空间角度和数据结构角度的对数据的不同观测,来取长补短,优化结果训练过程1、划分数据集,比如我们有10000条训练集,...

2020-03-31 14:34:50 1449 2

原创 推荐系统----冷启动问题总结

本博客参考了《推荐系统实践》 项亮#有哪些解决推荐系统中冷启动的思路和方法#问题下,知乎大佬的回答冷启动推荐系统是根据用户的兴趣和历史行为对用户进行推荐,因此就需要大批的用户数据,对于一些大公司,他们已经累计了大量的用户数据,所以对他们来说这都不是什么问题,但是对于一些小公司,他们并没有那么多的数据,如何在没有大量用户数据的情况下设计个性化推荐系统,并让用户对推荐系统感到满意而愿意使用推...

2020-03-30 18:43:36 371

原创 机器学习----推一推SVM

本编博客参考了周志华老师 西瓜书https://blog.csdn.net/Heitao5200/article/details/86504544主要思想是找到一个超平面可以将两类样本都划分开来,并且让这两类样本都离这个超平面尽可能的远,增加模型行的泛化性。哈哈哈,公式太多了,直接上我手写的公式了。假设超平面 wTx + b = 0,样本空间中任意点到超平面的距离为:SVM求解我...

2020-03-29 15:40:08 190

原创 机器学习总结---集成学习Boosting----LightGBM

本文部分参考和摘录了以下文章,在此由衷感谢以下作者的分享!https://zhuanlan.zhihu.com/p/87885678https://blog.csdn.net/anshuai_aw1/article/details/83275299LightGBM a highly efficient gradient boosting decision treehttps://zhuan...

2020-03-28 17:07:24 341

原创 机器学习---集成学习boosting----GBDT/XGBoost

本片总结参考了https://www.jianshu.com/p/7467e616f227https://zhuanlan.zhihu.com/p/87885678https://zhuanlan.zhihu.com/p/85053333https://zhuanlan.zhihu.com/p/67300801百面机器学习之前在天池了解了一下算法竞赛,自己也参加了智能海洋建设的算法竞赛...

2020-03-05 16:41:54 273

原创 机器学习--降维总结--PCA\LDA\SVD

本文部分参考和摘录了以下文章,在此由衷感谢以下作者的分享!https://zhuanlan.zhihu.com/p/77151308周志华老师的西瓜书百面机器学习开始咯!降维什么是降维呢,可以想象一个5 * 4矩阵乘以一个4 * 3 的一个矩阵,相当于对5 * 4的矩阵进行了线性变换,得到一个5 * 3的一个矩阵,他的维度就变成了5*3。那么降维有什么好处呢,我们为什么要进行降维?在...

2020-03-02 13:26:31 803 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除