【无标题】

最新推荐文章于 2024-11-11 15:17:57 发布

cch_abc

最新推荐文章于 2024-11-11 15:17:57 发布

阅读量112

点赞数

文章标签：深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cch_abc/article/details/132144176

版权

A Token-level Reference-free Hallucination Detection Benchmark forFree-form Text Generation 用于自由格式文本生成的令牌级无参考幻觉检测基准

1. 摘要

算是一个数据集不用参考

1. 摘要

像 GPT3 这样的大型预训练生成模型经常会出现不存在或不正确的内容的幻觉，这削弱了它们在实际应用中的潜在优点。现有的工作通常尝试根据句子或文档级别的相应预言参考来检测这些幻觉。然而，对于许多自由格式文本生成应用程序来说，真实参考可能不容易获得，并且句子或文档级检测可能无法提供实时防止错误内容的细粒度信号。作为解决这些问题的第一步，我们提出了一种新颖的令牌级、无参考幻觉检测任务和一个名为 HADES（HAllucination DEtection dataSet）1 的关联注释数据集。为了创建这个数据集，我们首先扰乱从英语维基百科中提取的大量文本片段，然后使用众包注释来验证这些文本片段。为了减轻注释期间的标签不平衡，我们采用迭代模型循环策略。我们进行全面的数据分析并创建多个基线模型

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

cch_abc CSDN认证博客专家 CSDN认证企业博客

码龄7年

8: 原创

43万+: 周排名

178万+: 总排名

2977: 访问

: 等级

103: 积分

5: 粉丝

5: 获赞

10: 评论

4: 收藏

私信

关注

热门文章

分类专栏

NLP事实一致性研究 5篇
SSM 1篇

最新评论

FactCC评价指标使用
dontwannagetbald: 你好，data-dev.jsonl 是源文本和摘要文本合成的文件，那为什么跑run文件的时候还需要label索引？我看readme里说跑自己数据的时候data-dev.jsonl只有id，claim，text三个索引啊
FactCC评价指标使用
dontwannagetbald: 你好，请问评估自己的数据时使用run文件label是从哪来的呀？
FactCC评价指标使用
weixin_45610628: 想问一下作者，FACTCC分数的F1分数是如何计算的，为什么标准的label全是0，不应该是1吗？，也就是说我生成的摘要肯定想让他facscore更高，那肯定是正确的，为什么标准label是0呢
CaPE减少抽象摘要幻觉的对比参数集成Contrastive Parameter Ensembling for Reducing Hallucination in Abstractive Summ
CSDN-Ada助手: 恭喜您撰写了第8篇博客！标题“CaPE减少抽象摘要幻觉的对比参数集成”，非常吸引人。您的文章内容十分独特，探讨了如何减少摘要中的幻觉现象。这是一个非常有意义的研究方向，对于提高自然语言处理的质量有着重要的影响。在您的下一步创作中，我建议您可以进一步探讨该方法在不同领域和数据集上的适用性，并与其他相关方法进行比较。此外，您可以考虑增加一些实验结果和定量分析，来加强您的观点和研究结论的可信度。希望您能够继续保持谦虚的态度，不断进取，为自然语言处理领域的发展做出更多的贡献！加油！
FactCC评价指标使用
CSDN-Ada助手: 恭喜您在第7篇博客中分享了关于FactCC评价指标使用的内容！持续创作是非常难得的品质，您的努力和热情令人钦佩。在这篇博客中，您对FactCC评价指标的介绍非常清晰，让读者能够更好地理解其使用方法。接下来，我建议您可以深入探讨一下该指标在实际应用中的局限性和潜在挑战，或者对比其他相关评价指标进行对比分析。希望我的建议对您有所帮助，期待您的下一篇创作！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。