自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 Fake It ’Til You Make It:大模型时代的“血液提供商” - 数据合成技术

Gartner 预测():“到 2024 年,60% 的数据用于开发 AI 和分析项目将综合产生”, Gartner 指出,许多公司已经开始使用合成数据来训练他们的AI模型填补真实数据的不足,同时应对数据稀缺和隐私问题;2023年11 月发表在《自然》杂志上的也表明使用合成数据替代真实医疗保健数据的有效性。与。

2024-04-02 19:58:22 633

原创 SDG:高性能数据合成框架,保障数据安全开放与合成数据应用

然而,如此强大的模型也仍然存在一些局限性,例如:生成有内在关联关系的表格数据,ChatGPT这样的模型,难以彻底洞察不同特征(列)之间的内在联系,并在生成的数据中体现这种内在联系,所以此类语言模型形成高质量的表格数据。使用仿真数据代替真实数据可以保护敏感信息的隐私和安全,防止数据泄露和滥用,还可以通过仿真数据,可以在不需要真实数据的情况下进行模型训练和优化,从而大大节省时间和计算资源。:仿真数据可以帮助创建一个更通用的模型,因为仿真数据可以涵盖各种可能的情况,而真实数据可能只代表特定的情况或时间段。

2023-11-15 15:21:04 158

原创 Argus:结果审核引擎,保障敏感数据安全和可追溯性

Argus 将具备可视化的 AI 模型结构和出域数据检测功能,使用户能够深入了解 AI 模型的组成和出域数据的分析报告,通过各项指标来对比原始数据和出域数据的相似度,从而分析出域数据是否安全。此外,Argus 还将能够检测 AI 模型和出域数据中可能存在的隐私数据,例如个人身份信息和银行账号等,并及时发现和提醒这些隐私数据的存在,以便用户采取相应的措施来保护数据的安全性。未来,Argus 将具备数据水印技术,为每个数据添加唯一标识以确保数据的合法性和溯源性,用户可以追踪数据的来源和拥有者。

2023-10-23 09:20:08 213

原创 HSMConn:一个为商用密码硬件设备提供通用连接的C++开发库

密码技术作为网络和数据安全的基础支撑,为普及商用密码应用,商用密码开源势在必行。欢迎广大商用密码开发者,一起参与不断完善HSMConn项目。

2023-10-09 15:50:32 148 1

原创 基于eBPF的数据使用控制:DataUCon项目揭秘

DataUcon: 主仓库, 项目整体架构及组件介绍,并提供DataUcon应用案例场景Duetector: 支持eBPF的可扩展数据使用探测器, 进行环境监测并采集策略相关属性,该组件为使用控制过程中的核心组件Duefuse: 基于FUSE的数据使用控制执行点, 提供用户无感知的文件系统接口功能,该组件也是使用控制策略的执行点使用控制的前提是基于eBPF 进行跟踪、监控的系统操作信息,使策略能够依据详尽的信息进行决策,因此本阶段项目关键就是对Duetector的建设。

2023-09-27 18:08:31 117

原创 DBMasker:一个为主流数据库提供安全访问接口的Java三方库

DBMasker 是一个针对主流数据库系统的 Java 开源项目,旨在提供统一且安全的访问接口。它支持多种数据库,包括主流的关系型数据库(如 MySQL, Oracle, SQLite, PostgreSQL)以及国产数据库(如达梦、人大金仓、南大通用),还涵盖大数据仓库(如 HBase、Elasticsearch、Hive)。

2023-09-22 19:20:00 115 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除