自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

emphmeral的博客

原创 RAGAS

（对生成的答案有害性和正确性进行评估）其目的是根据预定义的方面（例如和）评估提交。此外，用户可以灵活地定义自己的方面，以便根据自己的具体标准评估提交内容。方面批评的输出是二进制的，指示提交是否与定义的方面一致。该评估是使用“答案”作为输入来执行的。LLM 评估员内部的批评根据所提供的方面评估提交的内容。Ragas Critiques 提供了一系列预定义的方面，例如正确性、有害性等（请参阅以获取完整列表）。如果您愿意，您还可以创建自定义方面来根据您的独特要求评估提交内容。strictness。

2024-01-12 10:12:29 923 1

原创交叉熵损失

loss = F.cross_entropy(logits, targets) 中首先将logits经过softmax转化为词表中对应词的预测概率probs，将targets展平之后化为one-hot向量与生成的概率求-sum(targets* log(probs))，其等价于直接对logits取log_softmax，然后取其中label作为index的值在log_softmax中取值，最后将这些取值求和取平均得到最后的loss值。

2024-01-12 10:10:57 385 2

原创 LongNet: Scaling Transformers to 1,000,000,000 Tokens

通过修改attention机制拓展token长度

2023-07-12 16:50:40 475 1

原创如何正确安装neuralcoref

安装neuralcoref用于共指解析（Coreference Resolution）任务。

2023-04-02 18:30:49 627

原创 DeBERTaV3

1.注意力解耦的增强解码 2.改进了BERT和RoBERTa

2023-02-23 21:49:05 542

原创 GPT Understands, Too

使用可训练的连续提示嵌入来调整GPTs和BERTs的性能

2023-02-23 17:37:46 100

原创 LoRA: Low-Rank Adaptation of Large Language Models低秩自适应

通过矩阵分解降低LLM中的模型参数

2023-02-23 16:45:42 5381

原创 AttributeError: ‘Transformer‘ object has no attribute ‘embedding‘

'xxxx' object has no attribute 'xxxx' 错误

2023-02-06 20:56:29 941

空空如也

关于卷积核数值的问题，如何解决？

2022-09-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

博客等级

码龄5年

8
原创

22
点赞

44
收藏

17
粉丝

关注

私信

热门文章

分类专栏

NLP 3篇

最新评论

交叉熵损失
DeepBERT: 将logits_softmax取log 改为将logits_softmax取-log
交叉熵损失
CSDN-Ada助手: 恭喜您撰写了关于“交叉熵损失”的博客！您对这个主题进行了深入的探讨，让我受益匪浅。希望您能继续分享关于机器学习和深度学习的知识，也许下一篇博客可以探讨一下如何在实际项目中应用交叉熵损失函数，或者是与其他损失函数的比较分析。谢谢您的分享，期待您更多的精彩内容！
RAGAS
CSDN-Ada助手: “恭喜你写了第8篇博客！RAGAS这个标题很有趣，我期待看到你更多关于RAGAS的内容。接下来，也许可以尝试添加一些音乐或视频元素，让读者更好地体验RAGAS的魅力。继续加油！”
LongNet: Scaling Transformers to 1,000,000,000 Tokens
CSDN-Ada助手: 恭喜您撰写了第6篇博客！标题“LongNet: Scaling Transformers to 1,000,000,000 Tokens”非常吸引人。您的研究对于将Transformer模型扩展到如此庞大的1,000,000,000个标记是非常令人印象深刻的。您的工作为我们理解和应用Transformer模型的可扩展性提供了重要的见解。在接下来的创作中，我想提出一点建议。考虑到您的研究成果，也许您可以探索如何进一步优化模型的训练和推断效率，以应对更大规模的文本任务。此外，您也可以考虑探索Transformer模型在其他领域的应用，如自然语言处理、计算机视觉等。尽管您已经取得了很大的成就，但我相信您在这些领域中仍然能够有所贡献。再次恭喜您的连续创作，并期待您未来更多的博客分享！

提示

确定要删除当前文章？

取消删除