Machine Learning Foundations 作业二 Question 9 解法

自从发表了台大线上课程,Machine Learning Foundations作业一与作业二的某些题目的解法后,陆续接到许多朋友的要求,希望我提供更多题目的解法。当然,网路上有许可供参考,本人在做题目时,也的确参考了那些解法。只是有些解法对我来说是一步登天,对于问题的彻底了解帮助有限。花了一些时间了解之后,希望能用深入浅出的方式,把问题说清楚,答案讲明白。

这道题目是该课程作业二的第9题,其解答为D+1。接下来为各位朋友说明这道题目的解题过程。 

首先,我们撇开sign不看,发现这是一个多项式的式子。我们先看D = 1的情况: 


D = 1时,y = c 0 + c 1 * x , 代表直线,可以改写成 y = s (x - a 1) 。我们从上图可以看出,s和a 1,这两个参数可以决定这条直线的样子。所以当D = 1时,VC dimension = 2

我们再来看D = 2: 


D = 2时,此多项式为一元二次的曲线,我们把这个曲线改写成 y = s (x - a 1) ( x - a 2) 。从上图可以看出,s、a 1、a 2,这三个参数可以决定这条曲线的样子。所以当D = 2时,VC dimension = 3

最后,来看D = 3: 


D = 3时,此多项式为一元三次的曲线,此曲线可以改写成 y = s (x - a 1) ( x - a 2) (x - a 3) 。从上图可以看出,s、a 1、a 2、a 3,这四个参数足以决定这条曲线的样子。所以当D =3时,VC dimension = 4。

我们可以检验一下,这种想法是否正确。拿D = 2,也就是若我们的Hypothesis为一元二次的曲线,那么它的VC dimension为多少?下图解释,N = 3代表有3个点要做分类,N = 4代表有4个点要做分类。分类的方法都是指定用一元二次的曲线。

先看N = 3:我们发现,一元二次曲线完全可以对所有情况做分类。共有2^3 = 8种情况。所以对于该hypothesis set H而言,在N = 3的情况下,此set的最大数量为mH(3)。

再看N = 4:有一种情况,想将4个点分为(+, -, +, -),用一元二次曲线是不可行的,只能交由一元三次曲线做分类。如下图所示。 


所以依照VC dimension的定义

d VC(H) = 3, for D = 2

推广之

d VC(H) = D + 1, for degree D

-Count 



机器学习是计算机科学中的一个重要分支,旨在通过设计和分析算法,使计算机系统能够从数据中自动学习和提高,并对未见过的数据提出准确的预测。在机器学习中,数据是关键。该领域利用计算方法对大量数据进行处理和分析,以发现数据中的模式和趋势。通过对这些数据模式进行建模和预测,机器学习使计算机系统能够自动地改进自己的决策和表现。 “基础机器学习”(Foundations of Machine Learning)是机器学习领域中的一个重要概念。它涵盖了机器学习的基本原理和算法,包括如何构建、评估和优化机器学习模型。这些基础理论和方法对于开发和使用先进的机器学习系统至关重要。 在基础机器学习中,重要的概念包括监督学习、无监督学习、半监督学习和强化学习。监督学习是一种从已知的训练数据中构建模型的方法,用于对新数据进行预测。无监督学习是一种从未标记的数据中挖掘模式的方法,而半监督学习则是两者的结合。强化学习则是一种通过与环境交互来学习的方法,根据奖励信号调整模型。 此外,基础机器学习还包括模型评估和选择、特征选择和提取、优化方法等。这些技术和方法使机器学习更加健壮和可靠,并为开发新的机器学习算法提供基础。 总的来说,基础机器学习是机器学习领域的核心概念之一,对于发展高级机器学习和人工智能系统至关重要。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值