第九周(异常发现+推荐系统)-【机器学习-Coursera Machine Learning-吴恩达】

目录
    异常检测
    多元高斯分布的异常检测

    推荐系统


1 异常检测

1)正态分布或高斯分布:


2)异常检测算法:


3)异常检测与监督学习的比较

使用异常检测算法的情况

- 不正常的样本较少,不利于学习;

- 导致不正常的原因有很多,不方便进行学习时

4)选择特征

当特征不符合正态分布时,可以利用log或者根号等运算改变所有样本该特征值,然后作图观察是否符合正态分布


2 多元高斯分布的异常检测

1)多元高斯分布

概率分布:


参数:


多元高斯分布与期望值μ和协方差有关,多元高斯分布中期望值μ便为一个向量的。

例如二维数据的概率分布:


2)多元高斯分布的异常检测算法

首先,根据样本计算多元高斯分布参数(期望 和 协方差)

然后,针对新样本计算P(x),如果小于设定值,则异常。

3)普通高斯模型 vs 多元高斯模型

 - 多元高斯模型能够捕捉不同特征之间的相关性
   必须 m>n,样本数量要多于特征变量数量
 - 普通高斯模型运算量小。

    如果要捕捉不同特征之间的关系,可以手动增加额外特征向量

错题:



2 推荐系统

1)协同:
 - 协同就是在训练过程中,每一个用户都在一起帮助系统更好的训练参数。
 - 每个用户对多个电影进行评分,每个电影被多个用户进行评分
 - 在知道用户对电影的评分之后:(x即电影特征、theta即用户参数)
给定每部电影的成分(爱情、动作..)分布 x,可以预测用户的喜好(爱情、动作..)分布 theta;

给定每个用户的喜好(爱情、动作..)分布 theta,可以预测每部电影的成分(爱情、动作..)分布 x ;


合并优化函数:


2)协同过滤算法:(预测用户给电影的打分)

 - 原理


 - 寻找相关电影进行推荐

当得到所有电影的特征分布之后,可以选择参数x距离最短的相关电影进行推荐

- 均值归一化,将所有用户针对某一电影的评分均一化有助于预测一个从来没有打过分的用户的评分,如果不均一化预测将总为0,如果均一化因为最后预测值中需要+平均值,所以预测就变为了平均值。

错题:


题目参考:
http://blog.csdn.net/sundy0808/article/details/78997898
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值