mao_feng-CSDN博客

原创当小样本遇上机器学习 fewshot learning

引言深度学习(deeplearning)已经广泛应用于各个领域，解决各类问题，例如在图像分类问题下，如图1，区分这10类目标的准确率目前可以轻松做到94%。然而，deeplearning是一种datahungry的技术，需要大量的标注样本才能发挥作用。图1 现实世界中，有很多问题是没有这么多的标注数据的，获取标注数据的成本也非常大，例如在医疗领域、安全领域等。因此，我们现在讨论的是...

2017-12-30 22:21:10 100379 46

本文提出了一种新的机器学习模型训练数据影响分析框架，称为Distilled Datamodel（DDM）。在线评价阶段，则通过对synset进行微调，并结合特定的模型行为评估需求，快速构建出针对不同测试样本的影响力矩阵，有效加速了模型行为分析过程。实验结果表明，与现有方法相比，DDM不仅能够更准确地识别影响模型预测的关键训练数据点，还具备较高的计算效率和更好的隐私保护能力。此外，DDM同样适用于复杂的模型架构和多样化的机器学习任务，展示了其作为理解模型行为、提升模型可靠性和促进模型解释性研究的强大潜力。

2025-06-12 11:38:12 139

原创如何评估单条数据对AI模型的影响

尽管估计仅针对训练集中z权重的微小变化而得出，但在实践中，它也被用作离散影响概念的合理估计，这是从训练数据集中完全添加/删除数据点的效果 [Koh和Liang，2017]。影响函数已被应用于解释预测并产生置信区间 [Schulam和Saria，2019]，调查模型偏差 [Brunet等人，2019，Wang等人，2019]，估计Shapley值 [Jia等人，2019，Ghorbani和Zou，2019]，改善人类信任 [周等人，2019]，并制作数据中毒攻击 [Koh等人，2019]。

2025-06-12 11:18:23 373

原创 AI模型的泛化性的第一性原理是什么？

AI模型中的泛化性（Generalization）指模型在未见过的数据上保持预测准确性的能力，其第一性原理（即最根本的驱动机制）可归结为模型对数据生成规律的本质性学习与复杂度控制。以下结合理论框架与实现机制展开分析：定义：泛化误差 $ R_{\text{exp}}(\hat{f}) $ 是模型 $ \hat{f} $ 在真实分布上的期望风险：Rexp(f^)=EP[L(Y,f^(X))]=∫X×YL(y,f^(x))P(x,y)dxdyR_{\text{exp}}(\hat{f}) = E_{P}[L(

2025-06-12 11:08:59 657

空空如也

空空如也