![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
李宏毅机器学习
文章平均质量分 87
KingNewest
这个作者很懒,什么都没留下…
展开
-
李宏毅机器学习 2021/2022 HW7 学习记录
由于段落可能很长,超过了模型能够一次处理的最大长度限制,所以需要将段落分成多个窗口,每个窗口包含段落的一部分,然后分别用模型对每个窗口进行预测。因此,在训练时,我们通常会选取包含答案的段落部分,使得模型能够专注于学习从这个特定的段落片段中提取答案。而“实际标签的概率分布”则是一个简单的分布,其中只有正确答案的开始和结束位置被标记为1,其他所有位置都被标记为0。观察答案部分,会发现部分答案是空白的,猜测是end<start导致,所以我们在代码中判断prob是否大于现有的之前,添加了一个判断。原创 2023-12-13 13:24:47 · 222 阅读 · 1 评论 -
李宏毅机器学习2021/2022 HW6 学习记录
本次的任务是用对抗性神经网络生成二次元人物头像,主要是三个部分:Generator、Discriminator和把它们组织起来的函数。原创 2023-11-30 21:36:36 · 418 阅读 · 0 评论 -
李宏毅机器学习2021/2022 HW5学习记录
用s2s来完成机器翻译的工作。这个代码要安装的库fairseq由于年代久远,有点兼容性问题,所以实际并没有跑代码,记录一下学习过程。原创 2023-11-20 20:48:33 · 192 阅读 · 1 评论 -
李宏毅机器学习2021 HW3 学习记录
主要的变化就是在全连接层中间添加了两个dropout层,这是因为观察到easy的代码训练时,训练集正确率上升但是验证集正确率不变的情况。伪标签图片的比例调整比较困难,因此采用第二种调整,为此需要在best_model之外设置变量来保存当前比较好的模型。以dataset相同的参数重建了一个数据集,并改变了.samples,筛选出具有高可能性的图片,添加标签。查阅了一些资料,多数是写在一个transform里面的,故调整如下。能达到他的medium标准,接下来就看扩充数据集的。把未分类的标签一起加入进来。原创 2023-11-16 21:09:16 · 110 阅读 · 1 评论 -
李宏毅机器学习2021 HW4 学习记录
输入处理:输入特征数到自注意力模型要求的输入特征数# 自注意力层:定义编码器的结构# 输出处理:将自注意力机制的输出转化为分类数量"""args:return:"""return out。原创 2023-11-16 21:06:36 · 78 阅读 · 2 评论 -
李宏毅机器学习2021/2022 HW2 学习记录
李宏毅2021&202/hw2原创 2023-11-08 11:20:13 · 111 阅读 · 1 评论