2.25机器学习数学基础笔记

机器学习与数学基础知识


数学基础(必须要把基础补起来才能够做下去)——微积分线性代数 入门(带个头)
机器学习典型方法
编程基础


动手实践教程代码


数据科学竞赛(这样比较靠谱)


实际项目经验

内容

机器学习分类一般思路,微积分基础:泰勒公式、导数梯度
概率与统计基础:概率公式、常见分布、常见统计量
线性代数基础:矩阵乘法的几何意义

机器学习定义

模式识别=数据挖掘
计算机视觉 语音识别 自然语言处理
应用广泛的领域

统计学习=有些专家认为这是一种视角

工程上各种学科交叉的

岗位的名字就会比较特定了:统计学习偏学术
机器学习的领域三大知识领域:计算机知识,数学统计知识,领域知识
如果三块:编程、领域知识、数学 都能够吃透的话,就叫做数据科学家的身份,要求还是比较高的

数学和编程如果好,就是机器学习
专门做研究的是数学特别好,领域的知识有一些,比如说各大研究院对数学的知识要求就会更高一些。编程不会多么高

统计:包括了常见算法,黑盒算法属于danger zone,很可能有问题,如果统计不了解,结果不知道怎么出来还是可能会出问题,只有知道了统计基础之后,才能更好地改代码,不然都不知道这些东西有问题

(从理论上来走各种算法,多元统计分析)

机器学习算法

无监督学习
虽然分为聚类和关联规则,但是有时候在实务当中将人工理解的规则抽象出来要好一些

监督学习
分类预测,回归分析
分类判断是好是坏(离散目标)
回归分析(连续的)

监督和无监督的区别
如果知道目标,比如知道性别判断抽烟,再去预测其他未知的,这个任务叫做监督学习算法,提前知道标签和目标。

监督学习算法经常用来做预测

深度学习可以做分类也可以做回归
数据挖掘不能仅仅使用算法,要知道他们的数学基础,否则容易出问题。Danger Zone
(数学基础相当重要!!!!!)

无监督学习
是基于前面的数据生成,这些数据不知道风格。无监督学习算法:预测
分类的任务实际上是想找到分类界
在这里插入图片描述

在这里插入图片描述
这种算法似乎更难一些,半监督学习是目标不知道

第一个问题就是是否监督学习?

强化学习用的算法就有些复杂,只有两个都掌握得比较好才向强化学习用的算法。
AlphaGo是强化学习
深度学习是一大类,是机器学习的一种,卷积神经网络

数据有标签,监督学习》分类》无监督

重点

机器学习思路
得分函数,输入特征,得到标签

在这里插入图片描述

特征的重要性不是一样的,有的家庭看得特征不一样。最后运算得到一个概率值
算法最核心的目标就是得到权重,逻辑回归的函数
绝大数目标就是得到权重值

损失函数
假定已经得到得分函数,有误差,把误差算出来,得分函数的函数,找到得分函数,使得最终损失函数是最小的,权重θ就是希望得到的机器学习的结果,《最优化》的问题
41:50

非凸函数找最小值,局部最低点。

来看一些算法

在这里插入图片描述

上面是连续标签
下面是离散标签
Scikitlearn 图怎么用scikitlearn去做你的数据分析问题

相关的学习资料

在这里插入图片描述
吴恩达视频挺好

机器学习基石(吃掉这块硬石头!!)

#高数回顾
夹逼定理
二阶导数表示斜率变化的快慢
泰勒公式
方向导数:标量
梯度:向量
梯度的方向是函数在该点变化最快的方向
梯度下降法 (在求解损失函数最优化问题当中可能就会用到,前提是函数是凸函数)

56:10
函数二阶可导,求出来的二阶导数大于零,那么曲线就是凹函数,有全局最小值
凸函数

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Machine Learning(机器学习)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。在过去的十年中,机器学习帮助我们自动驾驶汽车,有效的语音识别,有效的网络搜索,并极大地提高了人类基因组的认识。机器学习是当今非常普遍,你可能会使用这一天几十倍而不自知。很多研究者也认为这是最好的人工智能的取得方式。在本课中,您将学习最有效的机器学习技术,并获得实践,让它们为自己的工作。更重要的是,你会不仅得到理论基础的学习,而且获得那些需要快速和强大的应用技术解决问题的实用技术。最后,你会学到一些硅谷利用机器学习和人工智能的最佳实践创新。 本课程提供了一个广泛的介绍机器学习、数据挖掘、统计模式识别的课程。主题包括: (一)监督学习(参数/非参数算法,支持向量机,核函数,神经网络)。 (二)无监督学习(聚类,降维,推荐系统,深入学习推荐)。 (三)在机器学习的最佳实践(偏差/方差理论;在机器学习和人工智能创新过程)。本课程还将使用大量的案例研究,您还将学习如何运用学习算法构建智能机器人(感知,控制),文本的理解(Web搜索,反垃圾邮件),计算机视觉,医疗信息,音频,数据挖掘,和其他领域。 本课程需要10周共18节课,相对以前的机器学习视频,这个视频更加清晰,而且每课都有ppt课件,推荐学习。 我和我的团队翻译了部分视频,目前已经翻译完毕,内嵌中英文字幕,推荐使用potplayer。此外,我无偿把字幕贡献给了网易云课堂,他们开了免费课:吴恩达机器学习。 这篇中文笔记,主要是根据视频内容和中文字幕以及ppt来制作,部分来源于网络,如“小小人_V”的笔记,并持续更新。 本人水平有限,如有公式、算法错误,请及时指出,发邮件给我,也可以加我qq。 今日发现这个笔记被下载超过10万次,应该说这个笔记有点用,我发现以前一些翻译小错误,进行了修改,以免误导初学者。 黄海广 2018-3-7 夜
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值