大模型备案语料来源安全要求

最新推荐文章于 2024-06-07 09:53:55 发布

AI合规备案中心

最新推荐文章于 2024-06-07 09:53:55 发布

阅读量324

点赞数 6

分类专栏：大模型备案文章标签：大模型备案算法备案算法备案代办

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shadowteamcn/article/details/139381586

版权

大模型备案专栏收录该内容

1 篇文章 0 订阅

订阅专栏

大模型备案的语料来源安全要求，对服务提供者的要求如下。

a）语料来源管理方面：

1）面向特定语料来源进行采集前，应对该来源语料进行安全评估，语料内容中含违法不良信息超过5%的，不应采集该来源语料；

2）面向特定语料来源进行采集后，应对所采集的该来源语料进行核验，含违法不良信息情况超过5%的，不应使用该来源语料进行训练。

b）不同来源语料搭配方面：应提高语料来源的多样性，对每一种语言的语料，如中文、英文等，以及每一种类型的语料，如文本、图片、音频、视频等，均应有多个语料来源；如需使用境外语料，应合理搭配境内外来源语料。

c）语料来源可追溯方面：

1）使用开源语料时，应具有该语料来源的开源许可协议或相关授权文件；注1：对于汇聚了网络地址、数据链接等能够指向或生成其他数据的情况，如果需要使用这些被指向或生成的内容作为语料，应将其视同于自采语料。

2）使用自采语料时，应具有采集记录，不应采集他人已明确不可采集的语料；注2：自采语料包括自行生产的语料以及从互联网采集的语料。注3：明确不可采集的语料，例如已通过robots协议或其他限制采集的技术手段明确表明不可采集的网页数据，或个人已拒绝授权采集的个人信息等。

3）使用商业语料时： —— 应有具备法律效力的交易合同、合作协议等； —— 交易方或合作方不能提供语料来源、质量、安全等方面的承诺以及相关证明材料时，不应使用该语料； —— 应对交易方或合作方所提供语料、承诺、材料进行审核。

4）将使用者输入信息当作语料时，应具有使用者授权记录。

d）按照我国网络安全相关法律法规及政策文件要求阻断的信息，不应作为语料。

私信我们，获得大模型备案与算法备案在线指导，助您快速通关，产品早日上线！

AI合规备案中心

关注

6
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
大模型备案语料来源安全要求

2）使用自采语料时，应具有采集记录，不应采集他人已明确不可采集的语料；b）不同来源语料搭配方面：应提高语料来源的多样性，对每一种语言的语料，如中文、英文等，以及每一种类型的语料，如文本、图片、音频、视频等，均应有多个语料来源；如需使用境外语料，应合理搭配境内外来源语料。2）面向特定语料来源进行采集后，应对所采集的该来源语料进行核验，含违法不良信息情况超过5%的，不应使用该来源语料进行训练。1）面向特定语料来源进行采集前，应对该来源语料进行安全评估，语料内容中含违法不良信息超过5%的，不应采集该来源语料；
复制链接

扫一扫

专栏目录

AI合规备案中心 CSDN认证博客专家 CSDN认证企业博客

码龄1年

25: 原创

28万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

554: 积分

186: 粉丝

274: 获赞

13: 评论

237: 收藏

私信

关注

热门文章

分类专栏

最新评论

法律合规：AI产品法律风险应对措施全解析（二）
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
AI资讯|AI产品风险解析：合规备案是关键
CSDN-Ada助手: 恭喜用户写出了第19篇博客，内容关于AI产品风险解析，着重指出了合规备案的重要性。这篇博文对AI行业发展和风险防范起到了积极的指导作用。希望用户能够继续保持创作的热情和耐心，为读者带来更多有价值的内容。建议下一步可以深入探讨AI产品在不同场景下的应用案例，为读者提供更具体的参考和启发。期待您的下一篇作品！祝您创作顺利，不断进步。
AI合规| AI产品为何会被下架？算法备案是前置条件
CSDN-Ada助手: 恭喜用户发布了新的博客！标题“AI合规| AI产品为何会被下架？算法备案是前置条件”非常引人注目，探讨了AI产品合规性的重要性。希望您能继续保持创作的热情和耐心，为读者带来更多有价值的内容。或许在下一篇博客中，您可以深入探讨算法备案的具体步骤和注意事项，让读者对AI产品合规性有更全面的了解。期待您的下一篇作品！
美国组建人工智能安全研究所联盟，微软、OpenAI和谷歌等200多家实体加入
CSDN-Ada助手: 恭喜作者第16篇博客发布！标题所述的美国组建人工智能安全研究所联盟的消息确实令人振奋。希望作者能继续分享更多关于人工智能安全领域的最新动态和研究成果。或许可以探讨该联盟的具体研究方向、成员间的合作模式以及未来的发展趋势，这些内容可能会让读者更加期待。期待作者的下一篇精彩文章！
AIGC服务企业中数据出境和数据合规问题解决方案
CSDN-Ada助手: 恭喜您撰写了第15篇博客，题为“AIGC服务企业中数据出境和数据合规问题解决方案”。您对这个热门话题进行了深入的探讨，为企业在数据管理方面提供了有价值的解决方案。您的文章内容不仅详实，而且言之凿凿，对读者具有很大的启发作用。在接下来的创作中，我建议您继续关注数据安全领域的新动态，例如数据隐私保护、跨境数据传输等问题。您可以分享一些实用的案例分析，或者提供一些实施该解决方案的具体步骤和技巧，以帮助企业更好地应对挑战。期待您的下一篇博客能够再次给读者带来新的思考和启示！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。