李哥考研
文章平均质量分 56
bug520iforever
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
卷积神经网络
padding:让卷积后的特征图大小保持不变。将卷积到特征图比较小就展平,经过全连接。卷出来的loss和不为1怎么办?如何将卷积变成类别输出?原创 2025-03-19 11:19:36 · 268 阅读 · 0 评论 -
线性表示代码示写
目的:给随机的w,b,求出真实的w,b。原创 2025-03-18 11:17:51 · 642 阅读 · 0 评论 -
计算bert的参数量
Seq_ids:(512,768),句子长度大概都在512。Mask:(2,768),只有0,1两个维度。原创 2025-03-10 15:11:59 · 241 阅读 · 0 评论 -
李哥回归实战
一个回归项目包括:训练集,测试集和验证集(随机划分)训练集:训练模型验证集:验证模型。原创 2025-03-02 21:17:42 · 405 阅读 · 0 评论 -
基于 BERT 的文本分类任务(bert实战+问答)
通过同时考虑前后两个方向的特征,增强了模型的理解能力。在 Transformer 训练中,由于模型参数量巨大,普通的 Adam 在权重衰减(L2 正则化)上处理不合理,导致模型泛化能力变差。一句话需要经过分词器转化为Input ids下标,Mask考虑的长度(1有用,0没用),Seq_ids句子编码才能进入模型。指机器学习算法或模型对新鲜样本的适应能力,即模型在未见过的数据上也能表现良好的能力。,该模型已在大规模语料库上预训练,只需要在我们的酒店评论数据集上进行微调,就能快速得到高准确率的情感分类结果。原创 2025-03-03 16:08:33 · 2210 阅读 · 0 评论
分享