![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 94
NumX
这个作者很懒,什么都没留下…
展开
-
XGBoost分析总结
认识XGBoost是在参加kaggle网站的机器学习比赛上接触到的。听一些过来者说用xgboost,分分钟上top10%。然而我用过之后发现并没有显著提升,一定是理解不够。要知道在2015年的时候29个kaggle比赛,17个用到了xgboost,其中8个是只用xgboost就达到第一的名次。相对的第二流行的是神经网络的方法。而在KDDcup2015编程比赛中,前十的队伍都用了XGboost。作为原创 2016-12-21 09:17:08 · 8307 阅读 · 2 评论 -
数据挖掘之_SVD的python实现和分析pin
前言 今日实现第一个推荐算法,在”机器学习实战“一书中找到了SVD方法一章练习。这里总结下笔记经验,与大家分享 。 简介 对于一个简单的推荐系统,例如电影推荐,我们知道N个用户对M个电影的评分。这时候对于一个新的用户,我们应该如何给他推荐新的电影呢?一个最简单的方法,根据用户已看的电影,找出与他相似的用户,然后推荐其他未看的高得分的电影。SVD提供了一个更加准确的解决方案。其基本思想是,降维原创 2016-12-20 10:51:39 · 4461 阅读 · 1 评论 -
谈谈linear regression 和 SVM
线性分类是一个简单而又非常实用的概念。因为其速度快,在工业界中广泛应用。 SVM一般是学习机器学习接触的又一个学习方法,非常fasion,学术界研究大热,数学上有严格的证明。但是由于神经网络的优异表现,风头渐渐不如以前。 这里就一个知识点进行自己小小总结。 线性回归和SVM有什么区别呢。网上很多人直接拿出这张图给你。例如知乎上这个答案 https://www.zhihu.com/qu原创 2017-02-27 17:15:24 · 4824 阅读 · 0 评论