自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 推荐系统实践-利用用户行为数据

通过算法自动发掘用户行为数据,从用户的行为中推测出用户的兴趣,从而给用户推荐满足他们兴趣的物品。 基于用户行为分析的推荐算法是个性化推荐系统的重要算法,学术界一般将这种类型的算法称为协同过滤算法。 用户行为在个性化推荐系统中一般分两种:显性反馈行为(explicit feedback)和隐性反馈行为(implicit feedback)。显性反馈行为包括用户明确表示对物品喜好的行为。隐性反馈行为

2017-09-27 22:01:21 482

原创 机器学习实战-利用SVD简化数据

利用SVD(Singular Value Decomposition),即奇异值分解,我们可以用更小的数据集来表示原始数据集。这样做,其实是去除了噪声和冗余信息。

2017-08-28 20:28:48 480 1

原创 推荐系统实践-好的推荐系统

从某种意义上说,推荐系统和搜索引擎对于用语来说是两个互补的工具。搜索引擎满足了用户有明确目的时的主动查找需求,而推荐系统能够在用户没有明确目的的时候帮助他们发现感兴趣的内容。

2017-08-25 11:02:53 334

原创 机器学习实战-利用PCA来简化数据

在体育比赛中,人们面对的原本是百万像素的数据,但是只有球的三维位置才最重要,这就成为降维(dimensionlity reduction)。通常而言,我们在应用其他机器学习算法之前,必须先识别出其相关特征。

2017-08-21 21:58:59 328

原创 机器学习实战-使用FP-growth算法来高效发现频繁项集

上一章介绍了发现频繁项集与关键规则的算法,本章将继续关注发现频繁项集这一任务。我们会深入探索该任务的解决方法,并应用FP-growth算法进行处理。这种算法虽然能更为高效地发现频繁项集,但不能用于发现关联规则。

2017-08-18 21:36:46 451

原创 机器学习实战-使用Apriori算法进行关联分析

从大规模数据集中寻找物品间的隐含关系被称作关联分析或者关联学习。本章将主要介绍Apriori算法来解决问题。

2017-08-16 21:43:04 422

原创 机器学习实战-利用K-均值聚类算法对未标注数据分组

聚类是一种无监督学习,它将相似的对象归到同一个簇中。他有点像全自动分类。 簇识别给出聚类结果的含义。假定一些数据,现在将相似数据归到一起,簇识别会告诉我们这些簇到底都是些什么。

2017-08-16 16:03:05 283

原创 机器学习实战-树回归

本章介绍一个新的叫做CART(分类回归树)的树构建算法。该算法既可以用于分类还可以用于回归,因此非常值得学习。

2017-07-13 20:44:14 433

原创 机器学习实战-预测数值型数据:回归

本章首先介绍线性回归,包括其名称的由来和实现。接下来本章将讨论回归在“欠拟合”的情况下的缩减技术。最后将融合所有技术预测鲍鱼年龄和玩具售价。

2017-07-06 21:24:45 600

原创 机器学习实战-利用AdaBoost元算法提高分类性能

元算法是对其他算法进行组合的一种方式。本章首先讨论不同分类器的集成方法,然后主要关注boosting方法及其代表分类器Adaboost。

2017-06-26 21:52:18 366

原创 机器学习实战-支持向量机

支持向量机 优点:泛化错误率低,计算开销不大,结果易于理解 缺点:对参数调节和核函数的选择敏感,原始分类器不加修改仅适用于处理二类问题 适用数据类型:数值型和标称型数据

2017-06-16 12:13:42 304

原创 机器学习实战-Logistic回归

假设现在有一些数据点,我们用一条直线对这些点进行拟合(该条线路为最佳拟合直线),这条拟合过程就称做回归。 基于Logistic回归和Sigmoid函数的分类 优点:计算代价不高,易于理解和实现 容易欠拟合,分类精度可能不高 适用数据类型:数值型和标称型数据梯度上升算法的基本思想:要找到某函数的最大值,最好的方法就是沿着该函数的梯度方法搜寻。

2017-05-25 22:11:44 308

原创 机器学习实战-朴素贝叶斯

前两章我们要求分类器作出艰难的抉择,不过分类器有时候会产生错误,这时会产生错误结果,这是可以要求分类器给出一个最优的类别猜测结果,同事给出这个猜测的概率估计值。

2017-04-24 18:05:31 316

原创 机器学习实战-决策树

第二章介绍的k-近邻算法可以完成很多分类任务,但是它最大的缺点就是无法给出数据内在的含义,决策树的主要优势在于数据形式非常容易理解。

2017-04-12 21:14:30 355

原创 机器学习实战-k-近邻算法

第一篇blog,因为刚想写的,第一个算法已经敲完了,从第二个算法开始慢慢细心敲喽

2017-04-12 17:04:39 342

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除