- 博客(20)
- 收藏
- 关注
原创 Datawhale X 李宏毅苹果书 AI夏令营task03
模型的选择和优化之间需要权衡,过小的模型可能因容量不足而欠拟合,过大的模型则可能过拟合。反之,则可能是模型容量不足。当模型过于简单时,它可能无法捕捉到数据中的复杂关系,导致模型集合(由不同参数θ定义的函数集合)过小,无法包含能够显著降低损失函数的理想函数。不匹配跟过拟合其实不同,一般的过拟合可以用搜集更多的数据来克服,但是不匹配是指训练集跟测试集的分布不同,训练集再增加其实也没有帮助了。训练数据不足:如果训练数据很少,模型容易过分依赖这些数据点,导致在训练集上表现良好,但在新的数据上泛化能力差。
2024-09-02 21:17:53
895
原创 Datawhale X 李宏毅苹果书 AI夏令营task02
线性模型是通过线性组合输入特征来预测输出的一种模型。其基本形式为:y = b + wx其中,y 是预测值,b 是偏置(intercept),w 是权重(weight),x 是输入特征。
2024-08-31 15:20:03
1010
原创 Datawhale X 李宏毅苹果书 AI夏令营task01
机器学习(Machine Learning,ML)是让机器具备学习能力的技术,具体来说,就是让机器能够找到一个函数。通过找到这个函数,机器可以完成许多任务,例如语音识别和图像识别。深度学习(Deep Learning,DL)是机器学习的一个子领域,通常涉及更复杂的模型和算法。
2024-08-27 16:53:24
1023
原创 Datawhale AI 夏令营task02笔记
相比基于经验模型的baseline,机器学习模型lightgbm可以达到更好的预测效果。通过特征工程挖掘特征可以很快的提升模型预测效果,这是数据挖掘比赛中的主要优化方向。
2024-07-16 11:40:17
616
原创 Datawhale AI 夏令营task01笔记
赛题数据由训练集和测试集组成,为了保证比赛的公平性,将每日日期进行脱敏,用1-N进行标识。即1为数据集最近一天,其中1-10为测试集数据。数据集由字段id(房屋id)、 dt(日标识)、type(房屋类型)、target(实际电力消耗)组成。时间序列数据是指将某一统计指标的数值按其发生的时间先后顺序排列而成的数列。这种数据在自然、经济、社会等领域中广泛存在,如生态系统中动植物种群数量的变化、金融市场的股价波动、宏观经济指标等。
2024-07-16 09:40:33
314
原创 【TIS-100】wp
mov 指令用法:作用:将数据源(src)中的数据写入目标点(dst)例:# 这条指令将当前节点的 acc 置为 1mov 1 acc# 这条指令给下方节点发送数字 1mov 1 down# 这条指令将自己的 acc 中的数字发给下方节点# 这条指令从上方节点接收数字,并将收到的数字存入 accmov up acc# 这条指令从上方节点接收数字,并将收到的数字立刻传给下方节点。
2024-07-13 21:56:21
735
1
原创 CodeTON Round 7 (Div. 1 + Div. 2, Rated, Prizes!)
【代码】CodeTON Round 7 (Div. 1 + Div. 2, Rated, Prizes!
2023-11-27 10:46:24
57
1
原创 C语言分支和循环语句介绍
在C语言中,分支和循环语句是程序控制的重要组成部分。它们使程序能够根据条件执行不同的代码块,以及重复执行特定的代码片段。else语句在条件为假时执行else后面的代码块。switch语句用于根据表达式的值执行不同的代码块。如果条件为真,则执行if语句后面的代码块;否则,跳过if语句。if语句用于根据条件执行代码块。C语言分支和循环语句详解。
2023-11-09 21:41:15
58
1
原创 Educational Codeforces Round 157 [Rated for Div. 2]
【代码】Educational Codeforces Round 157 [Rated for Div. 2]
2023-11-03 23:58:47
78
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人