coursera Machine Learning Week 1学习笔记

最近开始在coursera上学习其著名的公开课程Machine Learning,特此用这一系列的博客来记录下自己的学习过程.


Part 1:Introduction

    由于只是一个介绍,也没有讲什么很特别的内容,有价值的地方就3个.

    1.Machine Learning的定义:A computer program is said to learn from experience E with respect to some task T and some performance measure P if its performance on T, as measured by P, improves with experience E.这段英文有点绕...翻译一下就是对于一个任务T,有一个指标P能够度量该任务完成的怎么样,而如果一个程序能够从一些以往的经验E中学习,并且通过该学习能够提高其对于任务T的指标P,那么该程序就可以算作是机器学习.或者去掉那些T啊P的就是说,一个程序在学习过人为给出的训练集之后能够提高它解决一个特定问题的能力.

    2.Supervised Learning(监督性学习):简单的来说就是给出的训练集中既包含属性,又包含最后的结果.其显著的特征就是预测某个目标属性的值或者其类标号.由此分为数值预测(regression)和分类(classify)

    3.Unsupervised Learning(非监督性学习):与监督性学习相比,非监督性学习没有一个要预测的目标属性,程序要做的就是把给出的数据中具有较为接近属性的元组合并为一类,也称为聚类.


Part 2:Linear Regression with One Variable

    什么是单变量的线性回归?简单的来说就是给出如下图中的红色的(x,y)对,然后计算出能最好的代表这些(x,y)对的线性函数y=kx+b。

    (这张图片来源于维基百科)

    视频中以科学的方法给我们构建了对于单变量线性回归的数学模型。

    首先,我们把需要拟合的直线记为假设函数(hypothesis function):

    看起来没有什么不同,不是么,只是把参数的符号变了一下而已。那么接下来,我们应该如何来估计拟合出来的直线对于原来的数据集有多匹配呢?

    我们可以换个角度来想,我们可以计算拟合出来的直线在原来的x值上做出的预测y',偏离真正的y的距离的平方,这个值就可以表示拟合的直线在x值处产生的误差,然后对所有的数据集中的x值进行这样的计算,再把所得的结果累加后除以x的个数m,我们就可以得到比较好的一个能够衡量拟合的直线是否足够接近给出的数据集的值,具体的公式如下:

    是不是感觉很熟悉,其实就是一个方差的公式,至于为什么要除以2,这是为了消去后面求导时由于平方而出现的2。

    于是我们就可以把我们的目标变为找到这样的参数θ0和θ1,使得J(θ0,θ1)的值最小。在这里我们可以使用梯度下降法(gradient descent),梯度下降法的基本思想就是每次往J(θ0,θ1)的值减少幅度最大的方向(即梯度方向)去走一小步,更新下θ0和θ1,然后重复,直到J(θ0,θ1)的值不变(到达了局部最小点)。


而对于我们当前的J(θ0,θ1)来说,它的分布情况是这样的:


所以说它不存在局部的最小点,只有一个全局最小值点,所以我们可以直接认为把用梯度下降法得到的参数θ0,θ1就是使得J(θ0,θ1)最小的参数。

具体的公式如下:

    如果把对应的偏导求解出来就是:


    这里的:=相当于编程语言的=,即赋值为。α为学习率(Learning Rate),用于控制更新时每一步走多远。

   

Part 3:Linear Algebra Review

    这部分主要介绍了一些线性代数的基本知识.好吧,我承认我偷懒直接跳过了这部分...

1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看REAdMe.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看REAdMe.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看READme.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
Coursera机器学习是由斯坦福大学教授Andrew Ng主讲的一门在线课程,旨在向学习者介绍机器学习的基本概念、算法和应用。该课程涵盖了监督学习、无监督学习、深度学习等多个方面,通过理论讲解和实践编程作业,帮助学习者掌握机器学习的基本原理和实践技能。该课程是Coursera平台上最受欢迎的课程之一,也是机器学习领域入门的重要资源之一。 ### 回答2: Coursera机器学习是由斯坦福大学Andrew Ng教授设计并教授的在线课程。这门课程被认为是公认的机器学习入门教材之一,也是Coursera平台最受欢迎的课程之一。 这门课程涵盖了机器学习领域中最基础的知识和技术,包括监督学习、无监督学习以及神经网络等。学生可以通过该课程了解到如何采集和处理数据、如何训练模型、如何评估模型的性能等。此外,课程还涉及到机器学习中一些实用的技术,如正则化、梯度下降等。 该课程受到了全球范围内的认可和青睐,许多学生、工程师、数据科学家等都受益于该课程。由于该课程的知识点全面、深入浅出、容易理解和学习,在业内和学术界都广受赞誉,拥有较高的知名度和价值。 总之,Coursera机器学习是一门非常好的课程,对于那些对机器学习感兴趣的人来说,它是一个不可错过的机会。课程教材内容丰富、难度适中,且教学相对轻松愉悦,难怪在学习资源上产生了广泛的影响。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值