机器学习数学基础训练三

上午

1.将向量下标为偶数的分量 (x2, x4, …) 累加, 写出相应表达式.

答:
∑ i / 2 = 0 x i \sum_{i/2=0}x_i i/2=0xi

2.各出一道累加、累乘、积分表达式的习题, 并给出标准答案.

答:

累加: X = { 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 } , 求 ∑ i / 2 = 1 x i 2 \mathbf{X}=\{1,2,3,4,5,6,7,8\},求\sum_{i/2=1}x_i^2 X={1,2,3,4,5,6,7,8},i/2=1xi2

答案:

public class sumtest 
{
	public static void main(String [] args) 
	{
        int sum = 0;
        int x[]= {1,2,3,4,5,6,7,8};
        for (int i = 1; i <= 8; i++)
        {  	
        	if (i%2==1)
        		sum =sum + x[i]*x[i];
        }
    System.out.println(sum);
	}
}

输出:120

累乘:求 ∏ i , j a i j \prod_{i ,j} \mathbf{a_{ij}} i,jaij

A = [ 1 3 5 2 4 6 ] \mathbf{A}=\left[\begin{matrix} 1&3&5\\ 2&4&6\\ \end{matrix}\right] A=[123456]
答:

public class product {
	public static void main(String [] args) 
	{
		int production=1;
		for(int i=1;i<=6;i++)
		{
			production*=i;
		}
		System.out.println(production);
		}
	}

输出:720

积分:求 ∫ 1 2 x 2 + 1 / x   d x . \int_{1}^{2} x^2 + 1/x\ \mathrm{d}x. 12x2+1/x dx.

答:手算:
原式 = ( 1 / 3 x 3 + l n ( x ) ) ∣ 1 2 = 7 / 3 + l n ( 2 ) ≈ 3.02 =(1/3x^3+ln(x))|^2_1=7/3+ln(2)≈3.02 =(1/3x3+ln(x))12=7/3+ln(2)3.02
程序:

	public static void main(String [] args)
	{
	double integration = 0;
	double delta = 0.01;
	for (double x = 1; x <= 2; x += delta)
		{
			integration += (x*x+1/x ) * delta ;
		}
	System.out.println(integration);
	}
}

输出:3.014003430481827

3.你使用过三重累加吗? 描述一下其应用.

答:还真没用过,可以用于矩阵的乘法。

下午

1.自己写一个小例子 (n = 3 ,m=1) 来验证最小二乘法.

答:

xy
11
22
33

建立线性模型: y = f ( x ) = a x + b y=f(x)=ax+b y=f(x)=ax+b 求系数 a , b a,b a,b.
{ 1 = 1 a + b , 2 = 2 a + b , 3 = 3 a + b } → a = 1 , b = 0. \{1=1a+b,2=2a+b,3=3a+b\}→a=1,b=0. {1=1a+b,2=2a+b,3=3a+b}a=1,b=0.
f ( x ) = x f(x)=x f(x)=x
最小二乘法:
X = [ 1 , 2 , 3 ] , w = [ a ] \mathbf{X}=[1,2,3],\mathbf{w}=[a] X=[1,2,3],w=[a]
y i = x i ∗ a + b y_i=\mathbf{x_i}*a+b yi=xia+b
w = ( X T X ) − 1 X T Y = E \mathbf{w}=(\mathbf{X^T}\mathbf{X})^{-1}\mathbf{X^T}\mathbf{Y}=\mathbf{E} w=(XTX)1XTY=E
a = 1 a=1 a=1,带入后求得 b = 0 b=0 b=0,与建立线性模型得到的结果一致。

晚上

推导逻辑回归,描述特点

答:虽名叫回归,但实际完成的是分类任务。
如何找出最优的超平面?先谈一下什么样的超平面是理想的。
我们希望得到的超平面(用参数 w \mathbf{w} w确定,最终目的就是确定参数 w \mathbf{w} w),可以实现绝大部分样本的正确分类,且每个样本分类的确信度都比较高。这里确信度可以通过函数间隔( x i w \mathbf{x_iw} xiw)来反应。
确信度:将函数间隔通过sigmoid函数映射,可以得到一个值在{0,1}间的“概率 P P P”。如果分类正确 P P P会大于0.5,并且距离超平面越远,确信度越高, P P P越无限接近于1;如果分类错误 P P P会小于0.5。
P ( y = 1 ∣ x ; w ) = 1 1 + e − x w P(y = 1 \vert \mathbf{x}; \mathbf{w}) = \frac{1}{1 + e^{-\mathbf{xw}}} P(y=1x;w)=1+exw1表示预测结果为1的概率。
P ( y i ∣ x i ; w ) = P ( y i = 1 ∣ x i ; w ) y i ( 1 − P ( y i = 1 ∣ x i ; w ) ) 1 − y i P(y_i \vert \mathbf{x_i}; \mathbf{w}) = P(y_i= 1 \vert \mathbf{x_i}; \mathbf{w})^{y_i} (1-P(y_i= 1 \vert \mathbf{x_i}; \mathbf{w}))^{1-y_i} P(yixi;w)=P(yi=1xi;w)yi(1P(yi=1xi;w))1yi此为预测结果的概率。自然希望越大越好。
优化目标: arg max ⁡ w L ( w ) = − 1 / m ∏ i n P ( y i ∣ x i ; w ) \argmax_{\mathbf{w}}L(\mathbf{w})=-1/m\prod_i^nP(y_i|\mathbf{x_i;w}) wargmaxL(w)=1/minP(yixi;w)为计算方便,去除前项 − 1 / m -1/m 1/m,所以新优化目标变为:
arg min ⁡ w L ( w ) = ∏ i n P ( y i ∣ x i ; w \argmin_{\mathbf{w}}L(\mathbf{w})=\prod_i^nP(y_i|\mathbf{x_i;w} wargminL(w)=inP(yixi;w计算复杂,转为求对数:
log ⁡ L ( w ) = ∑ i = 1 n log ⁡ P ( y i ∣ x i ; w ) & = ∑ i = 1 n y i log ⁡ P ( y i = 1 ∣ x i ; w ) + ( 1 − y i ) log ⁡ ( 1 − P ( y i = 1 ∣ x i ; w ) ) & = ∑ i = 1 n y i log ⁡ P ( y i = 1 ∣ x i ; w ) 1 − P ( y i = 1 ∣ x i ; w ) + log ⁡ ( 1 − P ( y i = 1 ∣ x i ; w ) ) = ∑ i = 1 n y i x i w − log ⁡ ( 1 + e x i w ) \begin{aligned}\log L(\mathbf{w}) & = \sum_{i = 1}^n \log P(y_i \vert \mathbf{x}i; \mathbf{w})\&= \sum{i = 1}^n y_i \log P(y_i = 1 \vert \mathbf{x}_i; \mathbf{w}) + (1 - y_i) \log(1 - P(y_i = 1 \vert \mathbf{x}i; \mathbf{w}))\&= \sum{i = 1}^n y_i \log \frac{P(y_i = 1 \vert \mathbf{x}_i; \mathbf{w})}{1 - P(y_i = 1 \vert \mathbf{x}_i; \mathbf{w})} + \log (1 - P(y_i = 1 \vert \mathbf{x}i; \mathbf{w})) = \sum{i = 1}^n y_i \mathbf{x}_i \mathbf{w} - \log (1 + e^{\mathbf{x}_i \mathbf{w}}) \end{aligned} logL(w)=i=1nlogP(yixi;w)&=i=1nyilogP(yi=1xi;w)+(1yi)log(1P(yi=1xi;w))&=i=1nyilog1P(yi=1xi;w)P(yi=1xi;w)+log(1P(yi=1xi;w))=i=1nyixiwlog(1+exiw)
对其求 w \mathbf{w} w的偏导,零偏导为0,此时为整体概率最大。但直接令为0却又求不出来,所以依靠梯度下降法求解。
∂ log ⁡ L ( w ) ∂ w = ∑ i = 1 n y i x i − e x i w 1 + e x i w x i & = ∑ i = 1 n ( y i − e x i w 1 + e x i w ) x i \begin{aligned} \frac{\partial \log L(\mathbf{w})}{\partial \mathbf{w}} & = \sum_{i = 1}^n y_i \mathbf{x}_i - \frac{e^{\mathbf{x}_i \mathbf{w}}}{1 + e^{\mathbf{x}_i \mathbf{w}}} \mathbf{x}i\& = \sum{i = 1}^n \left(y_i - \frac{e^{\mathbf{x}_i \mathbf{w}}}{1 + e^{\mathbf{x}_i \mathbf{w}}}\right) \mathbf{x}_i\end{aligned} wlogL(w)=i=1nyixi1+exiwexiwxi&=i=1n(yi1+exiwexiw)xi
梯度下降法解出参数 w \mathbf{w} w
可能有人疑惑为什么求最大不用梯度上升法却用了梯度下降法,是因为在构造损失函数时,为了计算方便,省去了前项的符号,所以,变为了求最小,自然是梯度下降法。
梯度下降法:
w t + 1 = w t − a ∂ log ⁡ L ( w ) ∂ w \mathbf{w}^{t+1}=\mathbf{w}^t-a\frac{\partial\log L(\mathbf{w})}{\partial \mathbf{w}} wt+1=wtawlogL(w)不论初始的 w \mathbf{w} w在最小值点的哪一边,梯度下降法都会使 w \mathbf{w} w以步长为 a a a的速度向最小值点移动,当移动到误差可以接受的范围时,便取这个 w \mathbf{w} w为最小值点。

特点:

1.在表示确信度时,不是直接采用几何间隔而是利用了函数间隔来反映确信度;
2.相对于线性回归,该映射范围只是一个值在(0,1)的概率,通过概率判断属于哪个分类;
3.sigmoid函数的图像告诉我们,绝大多数的点的输出相差不大,通过sigmoid函数,使得样本点更加密集,而且,见笑了比较极端的点对于整体的影响;
4.优化目标时,为了方便计算,省去了符号,这导致本应使用梯度上升法,转变为使用梯度下降法;同样为了方便计算,将复杂的累乘计算进行对数处理;
5.梯度下降法的使用,高效的求解了 w \mathbf{w} w

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
智慧校园的建设目标是通过数据整合、全面共享,实现校园内教学、科研、管理、服务流程的数字化、信息化、智能化和多媒体化,以提高资源利用率和管理效率,确保校园安全。 智慧校园的建设思路包括构建统一支撑平台、建立完善管理体系、大数据辅助决策和建设校园智慧环境。通过云架构的数据中心与智慧的学习、办公环境,实现日常教学活动、资源建设情况、学业水平情况的全面统计和分析,为决策提供辅助。此外,智慧校园还涵盖了多媒体教学、智慧录播、电子图书馆、VR教室等多种教学模式,以及校园网络、智慧班牌、校园广播等教务管理功能,旨在提升教学品质和管理水平。 智慧校园的详细方案设计进一步细化了教学、教务、安防和运维等多个方面的应用。例如,在智慧教学领域,通过多媒体教学、智慧录播、电子图书馆等技术,实现教学资源的共享和教学模式的创新。在智慧教务方面,校园网络、考场监控、智慧班牌等系统为校园管理提供了便捷和高效。智慧安防系统包括视频监控、一键报警、阳光厨房等,确保校园安全。智慧运维则通过综合管理平台、设备管理、能效管理和资产管理,实现校园设施的智能化管理。 智慧校园的优势和价值体现在个性化互动的智慧教学、协同高效的校园管理、无处不在的校园学习、全面感知的校园环境和轻松便捷的校园生活等方面。通过智慧校园的建设,可以促进教育资源的均衡化,提高教育质量和管理效率,同时保障校园安全和提升师生的学习体验。 总之,智慧校园解决方案通过整合现代信息技术,如云计算、大数据、物联网和人工智能,为教育行业带来了革命性的变革。它不仅提高了教育的质量和效率,还为师生创造了一个更加安全、便捷和富有智慧的学习与生活环境。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值