吴恩达机器学习课堂笔记

提示:根据哔哩哔哩吴恩达机器学习课程,随堂写的笔记心得体会。


前言

提示:这是吴恩达佬团队在Coursera新开设的机器学习课程;

详细课程链接请见:
(强推|双字)2022吴恩达机器学习Deeplearning.ai课程


提示:以下是本篇文章正文内容

一、第三课

1.第一周

正式进入无监督学习

1.什么是聚类

尝试将他们分组为相似特征的人。

1.k-means聚类算法

1.随机找的聚类的中心。随机猜测集群中心在哪里。距离哪一个簇中心近,属于哪一个簇。簇的中心在每一次循环中会改变位置。
2.没有分配点的话就删除一个集群。

2.优化目标
3.初始化
4.选择聚类数量

2.非线性检测(第二个聚类算法)

1.发现异常事件

在这里插入图片描述

2.高斯正态分布

1.应用异常检测。

3.异常检测算法
4.开发与评估异常检测系统
5.异常检测与监督学习对比

1.正例数量非常少时,异常检测算法非常合适。欺诈检测。安全相关的应用程序。
2.更多的正例和负例数据时,监督学习非常合适。试图检测你过去在训练集看到的数据。天气预报。

6.选择使用什么特征

1.尽可能让特征为高斯特征。

2.第二周

推荐系统

1.建议

通过预测用户未评价的电影,来决定是否推荐。

1.使用每个特征
2.协同过滤算法

1.从数据中得出特征。
在这里插入图片描述

3.二进制标签

2.均值归一化

在这里插入图片描述
在这里插入图片描述

1.TensorFlow

在这里插入图片描述
2.Auto gread

2.寻找相关特征

1.协同过滤算法提供相关算法。
在这里插入图片描述

3.协同过滤与基于内容的过滤

1.基于内容:使用特征来决定向什么项目推荐。

4.基于内容的过滤的深度学习方法
5.从大型目录中推荐
6.推荐系统中的伦理
7.内容过滤的TensorFlow方法

3.第三周

强化学习

1.火星探测器

状态机

2.强化学习的回报

1.奖励
更快的获得奖励可能比更多的奖励更能吸引人.
每一步都有折扣因子。
在这里插入图片描述

3.强化学习中的策略
4.审查关键概念

2.状态

在这里插入图片描述

1.动作价值函数

Q函数

2.贝尔曼方程

在这里插入图片描述
在这里插入图片描述

3.连续状态空间

1.可以处于范围内的任何一个位置。

1.登月器

设定奖励与负奖励

2.学习状态值函数
3.改进神经网络架构

多个可能输出
在这里插入图片描述

4.贪婪策略
5.强化学习的状态

4.总结

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值