- 博客(3)
- 收藏
- 关注
原创 学习笔记-Large scale machine learning
终于来到了倒数第二周,这章的主要内容是怎样应对超大样本量的机器学习项目,例如训练集有500万个样本。 之前我们曾提到,有时候样本量的多少决定了一个模型的好坏,当样本量达到一定数量级时,应用不同算法获得的结果差不多。有句名言“最后获胜的人往往是那些拥有最多数据量的人,而不是那些拥有最好算法的人”
2017-09-28 21:09:20 910
原创 学习笔记-异常检测(Anormaly Detection)
我们已有一些针对发动机检测的指标,和这些指标对应的检测值,我们需要根据一批新的检测值,确定一个发动机是否异常。
2017-09-24 13:08:08 3589
原创 学习笔记-推荐系统(Recommender systems)
推荐系统在现实中的应用很广:购物网站会根据顾客的购物历史给顾客推荐商品;电影网站也会根据你对一些电影的评分为你推荐新的电影。学完这一章后,发现这背后的逻辑还是挺简单的。 基本假设:用户对某电影的评分由该电影的内容属性组合(X)和用户对这些内容属性的喜好程度(Theta)所决定。1. Content based recommendations所谓Content based,即已知每部电影的内容属性,
2017-09-23 22:18:39 402
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人