自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据派THU

发布清华大学数据科学相关科研动态、教学成果及线下活动

  • 博客(5382)
  • 收藏
  • 关注

转载 将VAE用于时间序列:生成时间序列的合成数据

来源:DeepHub IMBA‍‍‍本文约3500字,建议阅读5分钟本文将使用一维卷积层、策略性的步幅选择、灵活的时间维度和季节性依赖的先验来模拟温度数据。变分自编码器(VAEs)是一种生成式人工智能,因其能够创建逼真的图像而备受关注,它们不仅可以应用在图像上,也可以创建时间序列数据。标准VAE可以被改编以捕捉时间序列数据的周期性和顺序模式,然后用于生成合成数据。本文将使用一维卷积层、策略性的...

2024-09-01 18:02:55 116

转载 入选ACL 2024!实现蛋白质数据与文本信息跨模态解读,中科大王翔团队提出蛋白质-文本生成框架ProtT3...

本文约4200字,建议阅读5分钟本文介绍了一个全新的蛋白质-文本建模框架 ProtT3,该框架通过跨模态投影器,将具有模态差异的 PLM 与 LM 结合,在蛋白质字幕、蛋白质问答、蛋白质-文本检索任务中均取得了优异性能。中国科学技术大学王翔,联合新加坡国立大学刘致远团队、北海道大学研究团队提出了一个全新的蛋白质-文本建模框架 ProtT3,该框架通过跨模态投影器,将具有模态差异的 PLM 与 LM...

2024-09-01 18:02:55 195

转载 CoLiDR: 使用聚合解缠表示进行概念学习

来源:专知本文为论文介绍,建议阅读5分钟在本文中,我们提出了一种新方法CoLiDR,该方法利用解缠表示学习框架来学习相互独立的生成因子,并随后通过一个新颖的聚合/分解模块将这些表示聚合为人类可理解的概念。深度神经网络的可解释性研究通过基于概念的模型提供了一种有前景的方法,以人类可理解的概念来解释模型行为。另一条平行的研究路径则侧重于将数据分布解缠为其底层生成因子,从而解释数据生成过程。虽然这两...

2024-08-31 17:01:39 28

转载 为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架...

来源:Science本文约3500字,建议阅读5分钟第一个基于大语言模型(LLM)从大型科学文献语料库中自动生成高质量科学开放性问答对的新型框架。问答(QA)数据集在推动自然语言处理(NLP)研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型,也可以有效评估大语言模型(LLM)的能力,尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集,涵盖了医学、化学、生物等领域,...

2024-08-31 17:01:39 107

转载 源于清华的开源时序数据库IoTDB刷新世界纪录

本文约1200字,建议阅读5分钟由清华大学软件学院发起研制的国际开源时间序列数据库 Apache IoTDB 刷新了工业物联网场景榜单,在性能和成本维度上双双排名第一。2024 年 8 月 30 日,在国际事务处理性能委员会 TPC 组织的会议中,委员会正式公布了最新的国际权威数据库性能基准榜单。由清华大学软件学院发起研制的国际开源时间序列数据库 Apache IoTDB 刷新了工业物联网场景榜...

2024-08-31 17:01:39 171

转载 2024大数据能力提升项目招新宣讲会成功举行

8月28日晚,由清华大学研究生院和软件学院共同举办的清华大学大数据能力提升项目招新宣讲会成功举行,共有来自校内外近500人通过线上会议和直播的方式参会。大数据能力提升项目负责人、清华大学软件学院院长王建民讲到自2014年启动以来,已有超过三千名学生受益于该项目,他们不仅在知识上得到了丰富,更在职业生涯中获得了竞争优势。他强调,高质量的大数据对于当今大模型和人工智能发展的核心作用,并寄语同学们通过本...

2024-08-30 17:03:06 329

转载 比原始分辨率高36倍,北航、清华团队用AI在多空间组学平台上高分辨率表征组织,登Nature子刊...

来源:ScienceAI本文约2000字,建议阅读5分钟在本论文中,我们旨在通过关注多模态智能的三个关键维度来推动该领域的发展:多模态对齐性、鲁棒性和泛化性。空间组学的最新进展已将分子类别分析的范围扩展到转录组学之外。然而,许多此类技术都受到空间分辨率的限制,阻碍了科学家深入表征复杂组织结构的能力。现有的计算方法主要侧重于转录组学数据的分辨率增强,缺乏针对各种组学类型的新兴空间组学技术的适应性。...

2024-08-30 17:03:06 1081

转载 赠书 | 珊瑚书出版!从零开始,万行代码自制向量数据库

文中有数据派THU福利哦2023 年,向量数据库的风在 AI 圈吹得一浪高过一浪,好几个初创公司拿到了巨额投资。媒体挟向量数据库狂轰滥炸,一种技术同时在技术圈和投资圈如此受青睐的情况实属罕见。传统的数据库技术疲于应对向量数据在高维度、高精度和大规模场景下带来的巨大挑战,而 ChatGPT 等基于的生成式 AI 模型处理的正是此类数据。向量数据库“AI 大基建的”的位子基本做实,向量数据库的先行者们...

2024-08-30 17:03:06 1140

转载 深度学习必看的一篇经典论文!

本文约3200字,建议阅读6分钟本文论文由三位顶级大佬联合撰写----《Deep learning》。这是所有学习深度学习的小伙伴都必看的一篇论文,由卷积神经网络之父Yann Le Cun、Yoshua Bengio、深度学习界的领军人物Geoffrey Hinton三位顶级大佬联合撰写----《Deep learning》!论文摘要深度学习利用多层处理模型学习多层次抽象数据表示,显著提升语音识...

2024-08-30 17:03:06 1672

转载 【MIT博士论文】理解与提升机器学习模型的表征鲁棒性

来源:专知本文约1500字,建议阅读5分钟在本论文中,我们进一步分析了改进基础模型训练过程的方法及其局限性。现代机器学习模型的脆弱性引起了学术界和公众的广泛关注。在本论文中,我们将系统研究几种机器学习模型的理解与改进,包括平滑模型和通用表征网络。我们特别关注表征鲁棒性的研究,将其定义为给定网络在隐含空间中的“鲁棒性”(或广义上的可信属性)。对于通用表征网络,这对应于表征空间本身,而对于平滑模型,...

2024-08-30 17:03:06 1737

转载 【MIT博士论文】合成数据的视觉表示学习

来源:专知本文约1700字,建议阅读5分钟在本论文中,我们展示了我们最近为缩小这一差距并利用合成数据训练最先进的表示模型所做的努力。表示学习对于开发健壮的视觉系统至关重要。这一学习过程的有效性在很大程度上取决于数据的质量和数量。合成数据在灵活性、可扩展性和可控性方面具有独特的优势。最近生成式模型的进展使得合成逼真的图像和高质量文本成为可能,大大提高了合成数据的可行性。尽管有这些进展,合成数据在表...

2024-08-29 17:04:03 57

转载 必知!大模型背后的6大核心技术!

本文约3500字,建议阅读10分钟今天我们一同来探讨一下那些大模型背后的核心技术!一、TransformerTransformer模型,无疑是大型语言模型的坚实基石,它开启了深度学习领域的新纪元。在早期阶段,循环神经网络(RNN)曾是处理序列数据的核心手段。尽管RNN及其变体在某些任务中展现出了卓越的性能,但在面对长序列时,它们却常常陷入梯度消失和模型退化的困境,令人难以攻克。为了解决这一技术瓶...

2024-08-29 17:04:03 98

转载 抗击化疗耐药性与肿瘤复发!山东大学研究团队用 AI 构筑乳腺癌干细胞的有力防线...

本文约3800字,建议阅读10+分钟随着技术的不断进步和应用的深入,AI 将成为乳腺癌乃至癌症治疗中不可或缺的伙伴,为患者带来更多力量与希望。[ 导读 ]山东大学吕海泉、孙蓉、张凯及山西医科大学梅齐,联合螺旋矩阵公司等研究团队,取得了突破性进展,运用机器学习技术,基于 mRNA 的分析,成功开发了一种评估原发性乳腺癌患者样本中癌症干细胞特性的新方法 BCSC signature。乳腺癌,可谓是女...

2024-08-29 17:04:03 182

转载 独家 | LLM的旅程:从POC(概念验证)到生产环境(下篇)

作者:Adva Nakash Peleg翻译:付雯欣校对:赵茹萱本文约3100字,建议阅读10分钟本文将从实际项目需求出发,手把手带你了解LLM。使您的LLM引擎无状态和无服务器化在编写LLM引擎时,您可能会遇到“会话”或“对话”的概念。在这种情况下,我们需要将这些会话/对话的状态提取到可以在需要时加载的外部位置。这个外部位置可以是分布式缓存或数据库,可以从多个引擎工作节点访问。以下...

2024-08-28 17:00:41 79

转载 【MIT博士论文】非参数高维模型:稀疏性、效率、可解释性

来源:专知本文约1000字,建议阅读5分钟本论文探讨了机器学习中的集成方法,这是一种通过联合训练较简单的基模型来构建预测模型的技术。本论文探讨了机器学习中的集成方法,这是一种通过联合训练较简单的基模型来构建预测模型的技术。本文考察了三种类型的集成方法:加性模型、树集成模型和专家混合模型。每种集成方法都有特定的结构:加性模型可以涉及具有单变量或双变量的基学习器,树集成模型使用决策树作为基学习器,...

2024-08-28 17:00:41 136

转载 LongWriter:基于LLM代理可以将输出窗口大小扩展到10,000+个单词

来源:DeepHub IMBA‍本文约3000字,建议阅读9分钟本文为你介绍使用一个基于代理的流程,它将超长生成任务分解为子任务。LLM可以处理长达100,000个token的输入,但在生成超过2,000词的适度长度输出时仍然面临困难,因为模型的有效生成长度本质上受到其在监督微调(SFT)过程中所见样本的限制。为解决这个问题,本文的作者引入了AgentWrite,这是一个基于代理的流程,它将超...

2024-08-28 17:00:41 144

转载 【剑桥大学博士论文】卷积条件神经过程

来源:专知本文为论文介绍,建议阅读5分钟本论文在神经过程方面进行了三项进展。神经过程是一类使用神经网络直接参数化从数据集到预测的映射的模型家族。直接参数化这个映射使得神经网络能够在小数据问题中表现出色,而传统上神经网络在这种情况下容易过拟合。神经过程能够产生良好校准的不确定性,有效处理缺失数据,并且易于训练。这些特性使得该模型家族在医疗保健或环境科学等多个应用领域具有吸引力。本论文在神经过程方面...

2024-08-27 17:04:06 45

转载 材料探索新纪元!清华大学徐勇、段文晖团队发布神经网络密度泛函框架,打开物质电子结构预测的黑箱!...

本文约3500字,建议阅读7分钟本文为你介绍神经网络密度泛函理论框架。清华大学徐勇、段文晖研究组提出了神经网络密度泛函理论的理论框架,该框架统一了神经网络中损失函数的最小化与密度泛函理论中的能量泛函优化,为发展深度学习 DFT 方法开辟了一条崭新途径。密度泛函理论 (density functional theory, DFT) 作为一种用于预测和解释材料性质的关键工具,在物理、化学、材料科学等...

2024-08-27 17:04:06 57

转载 独家 | LLM的旅程:从POC(概念验证)到生产环境(上篇)

作者:Adva Nakash Peleg翻译:付雯欣校对:赵茹萱本文约3100字,建议阅读10分钟本文将从实际项目需求出发,手把手带你了解LLM。图:由DALL-E生成的图片试想一下:你有一个很棒的项目想法,可以通过大语言模型(LLM)来实现,并且很快实现了一个可运行的概念验证(POC)。你为自己感到骄傲,并惊讶于你只需很少的工作就能使其发挥作用。(只需五行prompt的魔力☺)但...

2024-08-27 17:04:06 130

转载 【KDD2024】预训练语言模型适应设备上用户意图预测的群体到个体调优框架

来源:专知本文为论文介绍,建议阅读5分钟我们提出了PITuning,这是一种从群体到个体的调优框架。移动设备,尤其是智能手机,支持丰富的功能,已经发展成为日常生活中不可或缺的工具。随着生成式人工智能服务的兴起,智能手机有望转变为个性化的助手,预测用户需求并相应地安排服务。在智能手机上预测用户意图,并基于过去的交互和上下文反映预期的活动,是实现这一愿景的关键步骤。现有的研究主要集中于特定领域,忽...

2024-08-26 18:20:52 34

转载 麻省理工/ CETI 团队用机器学习技术分离出抹香鲸发音字母表!高度类似人类语言系统,信息承载能力更强!...

本文约3200字,建议阅读6分钟用机器学习技术分离出抹香鲸发音字母表。麻省理工学院 Pratyusha Sharma 以及 CETI 的研究者使用机器学习对抹香鲸的录音进行了分析,证实了抹香鲸发出的声音具有结构性,由不同特征组合形成;并且分离出了抹香鲸发音字母表,与人类语言表达系统高度类似。在海洋生态学研究中,生物声学是人们获取海洋生物信息的重要途径。顾名思义,生物声学主要是对动物声音的生成、传...

2024-08-26 18:20:52 51

转载 2024中国高校计算机大赛——大数据挑战赛决赛在鄂尔多斯成功举办

8月25日上午,由全国高等学校计算机教育研究会、鄂尔多斯市人民政府和清华大学联合主办,鄂尔多斯市伊金霍洛旗人民政府、大数据系统软件国家工程研究中心、鄂尔多斯新能源研究院承办的2024中国高校计算机大赛——“大数据挑战赛”决赛,在内蒙古自治区鄂尔多斯大数据中心隆重举行。科技部高新司二级巡视员尉迟坚,鄂尔多斯伊金霍洛旗人民政府副旗长奇红梅,全国高等学校计算机教育研究会理事长、北京工业大学教授蒋宗礼,清...

2024-08-26 18:20:52 71

转载 综述 | 可解释性人工智能(XAI)在金融时间序列预测中的应用

来源:时序人本文约5200字,建议阅读10分钟本文介绍一篇来自加拿大学者所做的综述研究。当前,人工智能(AI)模型已经达到了较高的准确度水平。虽然其卓越的性能带来了相当大的好处,但其固有的复杂性却常常降低人类的信任度,从而减缓了它们在高风险决策领域(如金融)的应用。可解释性人工智能(XAI)领域旨在弥合这一差距,使AI模型更易于理解。本文介绍一篇来自加拿大学者所做的综述研究(由于篇幅限制,仅分...

2024-08-26 18:20:52 81

转载 【斯坦福大学博士论文】高效且可信的机器学习的统计方法

来源:专知本文约2500字,建议阅读5分钟本论文针对机器学习中的关键挑战,重点通过统计工具提高效率和可信性。它探讨了大模型和大数据时代的新兴课题,包括模型压缩、联邦学习和数据隐私。论文引入了新的模型和训练数据压缩方法,利用率失真理论和为机器学习任务特定设计的新型编码技术。此外,还提出了新的联邦学习框架,以在降低通信成本的同时保持甚至提高准确性和推理效率。这些框架采用了模型更新稀疏化、利用现代模...

2024-08-25 22:17:36 33

转载 深入浅出:可视化理解揭示决策树与梯度提升背后的数学原理

来源:Deephub Imba本文约15000字,建议阅读15分钟本文将通过视觉方式解释用于分类和回归问题的决策树的理论基础。决策树是一种非参数的监督学习算法,可用于分类和回归。它使用类似树的结构来表示决策及其潜在结果。决策树易于理解和解释,并且可以轻松地进行可视化。但是当决策树模型变得过于复杂时,它不能很好地从训练数据中泛化,会导致过拟合。梯度提升是一种集成学习模型,在其中结合许多弱学习器从...

2024-08-25 22:17:36 36

转载 ECCV2024 | 哈佛团队开发FairDomain,实现跨域医学图像分割和分类中的公平性

来源:ScienceAI本文约5100字,建议阅读8分钟本文聚焦于人工智能(尤其是医疗AI)中的公平性问题,这是实现公平医疗的关键。‍在人工智能(AI),特别是医疗AI领域中,解决公平性问题对于确保公平的医疗结果至关重要。最近,增强公平性的努力引入了新的方法和数据集。然而,在域转移的背景下,公平性问题几乎没有得到探索,尽管诊所常常依赖不同的成像技术(例如,不同的视网膜成像方式)进行患者诊断。本...

2024-08-25 22:17:36 38

转载 【CMU博士论文】自动化与可移植的机器学习系统

来源:专知本文为论文介绍,建议阅读5分钟在本论文中,我们旨在解决构建自动化和可移植ML系统的上述挑战,重点关注关键的ML系统层。由于机器学习(ML)及其应用的飞速发展,ML生态系统,包括模型、软件和硬件,正在迅速演变。然而,快速适应现有ML系统以支持新模型和硬件以最大化性能仍然具有挑战性且劳动密集。我们发现,这归因于现有ML系统在系统堆栈的几个关键层面上缺乏可移植性和自动化能力。然而,构建一个...

2024-08-24 17:00:21 24

转载 非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1

来源:机器之心本文约2000字,建议阅读10分钟Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。此后,采用 Mamba 架构的模型不断出现,比如 Mistral 发布的首个基于 Mamba 架构的开源大模型 Codestral...

2024-08-24 17:00:21 36

转载 独家| 复合人工智能系统的设计模式(对话式人工智能、CoPilots 和 RAG)-下篇...

作者:Raunak Jain 2024年3月18日翻译:陈之炎校对:zrx本文约3500字,建议阅读10分钟如何使用开源工具搭建流程可配置的复合人工智能系统。在上文中,我们介绍了何为复合人工智能系统,系统组件以及它们如何相互交互以构建复杂系统,基于LLM的自主智能体 —— 复合人工智能系统中的关键模块,以及复合人工智能系统的设计模式中关于定义的澄清和选择模式之前的考量。在下文中,我们将介绍复合...

2024-08-24 17:00:21 53

转载 校企共赢 | 走进清华&中石化研究生大数据实践基地

导读为进一步推动产教融合、增强研究生在大数据领域的实践创新能力,清华大学软件学院与中国石化工程建设有限公司(以下简称:SEI)于2024年7月共建了研究生专业实践基地,并成为清华大学在该年度成立的首个研究生专业实践基地。该基地旨在紧密连接大数据领域的研究生教育与行业实际需求,通过强化学生的实践技能和应用能力来促进学术界与产业界的深度融合。校企双方将共同规划和实施一系列实践项目,在这些项目中,既包括...

2024-08-23 18:28:54 40

转载 【ICML2024】量化稳定扩散中的原创性

来源:专知本文为论文介绍,建议阅读5分钟我们通过一个预训练的稳定扩散模型和一个合成数据集演示了我们的方法,展示了词元数量与图像原创性之间的关联性。本研究针对文本到图像(T2I)生成扩散模型中的原创性量化挑战,特别是聚焦于版权原创性。我们首先通过控制实验评估了T2I模型的创新和泛化能力,揭示出稳定扩散模型在训练数据足够多样化的情况下能够有效地再现未见过的元素。我们的核心见解是,模型熟悉并在训练中...

2024-08-23 18:28:54 40

转载 独家 | 复合人工智能系统的设计模式(对话式人工智能、CoPilots 和 RAG)-上篇...

作者:Raunak Jain 2024年3月18日翻译:陈之炎校对:zrx本文约3700字,建议阅读9分钟如何使用开源工具搭建流程可配置的复合人工智能系统。原文标题:Design Patterns for Compound AISystems (Conversational AI,CoPilots & RAG)原文链接:https://medium.com/@raunak-jain/...

2024-08-23 18:28:54 51

转载 使用CLIP模型进行零样本图像分类的分步指南

来源:Deephub Imba本文约4700字,建议阅读8分钟本文将介绍使用CLIP实现零样本图像分类的详细分步指南,从环境设置到最终的图像处理和分类。零样本学习允许AI系统对未明确训练过的类别进行图像分类,标志着计算机视觉和机器学习的重大进步。本文将介绍使用CLIP实现零样本图像分类的详细分步指南,从环境设置到最终的图像处理和分类。我们首先介绍零样本学习的概念及其在现代AI应用中的重要性。然...

2024-08-23 18:28:54 53

转载 【CMU博士论文】关于通过终任务感知训练实现资源高效的迁移学习

来源:专知本文约2000字,建议阅读5分钟本论文的结论部分将通过基于我们的既往工作,提出更多未来在资源高效迁移学习领域的研究方向,并建议一些新的研究分支。迁移学习是一种机器学习(ML)范式,通过利用其他任务中的“知识”来提高对目标任务的性能。这项技术已成为推动机器学习模型能力边界扩展的关键动力。当前的公式相对简单——在大量迁移任务数据上训练一个大型模型;然后将所学的模型零样本或经过适应性调整后...

2024-08-22 17:38:38 32

转载 直播预告 | 2024中国高校计算机大赛——大数据挑战赛总决赛

盛夏 8 月的鄂尔多斯伊金霍洛旗,是一幅美丽的画卷,在这片充满魅力和活力的草原上将有一场大数据的巅峰对决!“2024中国高校计算机大赛——大数据挑战赛总决赛”即将于8月25日震撼来袭!这不仅仅是一场比赛,更是一次思想的碰撞、技术的交流。全国高校的数据精英历经重重挑战,最终有6支团队从参赛的386 所高校 1777 支团队中脱颖而出,他们将以精湛的技术、独特的思维和无畏的勇气,挑战数据难题,挖掘数据...

2024-08-22 17:38:38 48

转载 报名 | 网络安全国家标准贯标深度行——标准进校园(清华站)

在数智化时代,网络安全已成为不可忽视的重要议题。为了进一步加强网络安全国家标准的宣贯实施,促进网络安全标准化人才的储备与建设,提升广大师生的网络安全标准化意识与应用标准化知识解决实际问题的能力,全国网络安全标准化技术委员会秘书处联合清华大学等国内一流高校网络安全相关学院,将于8月31日在清华大学共同举办“网络安全国家标准贯标深度行——标准进校园”主题活动,欢迎校内相关专业师生代表参加。活动信息时...

2024-08-22 17:38:38 48

转载 BIORAG: 结合大语言模型与检索增强生成的突破性研究,一种创新的生物问题推理框架...

来源:生物大模型本文约3000字,建议阅读5分钟本文介绍一种结合检索增强生成(RAG)与大语言模型(LLM)的生物问题推理系统。在当今快速发展的生命科学领域,如何高效地处理和解答复杂的生物学问题一直是一个巨大的挑战。随着研究的不断深入和跨学科合作的日益频繁,生物学知识体系变得越来越庞大和复杂。为了应对这一挑战,中国科学院计算机网络信息中心的研究团队提出了一种创新的框架——BIORAG,这是一种...

2024-08-22 17:38:38 49

原创 原创 | 结构熵理论及其应用(二)

作者:王佳鑫本文约3500字,建议阅读10分钟介绍一篇收录在《IEEE TRANSACTIONS ON INFORMATION THEORY》的论文。在上一篇《原创 |结构熵理论及其应用(一)》中我们详细讲述了结构熵的研究背景、网络一维和二维结构信息的基本定理。在此基础上,本文我们将重点讲述高维结构信息、编码树、最小结构熵等核心定理。前一篇中讲到一维结构信息通常定义为图的整个度分布的熵。具体来...

2024-08-22 17:38:38 868

转载 Skeleton Recall Loss 分割领域的新突破:极大的减少了资源消耗,还能提高性能

来源:DeepHub IMBA本文约2500字,建议阅读5分钟这篇论文则介绍了一个新的损失:Skeleton Recall Loss。精确分割在当今众多领域都是一项关键需求比如说自动驾驶汽车的训练、医学图像识别系统,以及通过卫星图像进行监测。在许多其他领域,当感兴趣的对象微小但至关重要时,例如研究血管流动、手术规划、检测建筑结构中的裂缝或优化路线规划,需要更高的精度。此前已经做了大量工作来解决...

2024-08-21 17:01:09 44

转载 【牛津大学博士论文】生成建模:解决模型错误指定和差分隐私中的开放问题...

来源:专知本文约1000字,建议阅读5分钟在本论文中,我们通过展示四项不同的研究,探讨了模型错误指定和差分隐私下的生成建模。生成建模已经成为人工智能的一个热门应用。然而,当生成模型被错误指定,或当生成模型估计器被修改以遵守差分隐私等隐私概念时,模型性能可能会受到负面影响。在本论文中,我们通过展示四项不同的研究,探讨了模型错误指定和差分隐私下的生成建模。我们首先介绍了生成建模的相关工作。随后,我...

2024-08-21 17:01:09 52

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除