自己的开题ppt分享做的很烂请喷我谢谢

最新推荐文章于 2025-05-03 09:07:35 发布

东东要拼命

最新推荐文章于 2025-05-03 09:07:35 发布

阅读量417

点赞数 1

分类专栏：小技巧文章标签：人工智能机器学习深度学习学习做学术ppt

本文链接：https://blog.csdn.net/qq_68308828/article/details/134126918

版权

20 篇文章

订阅专栏

研究背景与意义

给出自己要做的东西

钢铁异常检测方法为需求

回答以下这几个问题

所做任务在技术上的挑战性是什么？

（数学描述：数据层面、任务层面或者模型层面等）

什么原因导致这个挑战？

它为什么是个挑战？

这个挑战性导致什么结果/现象

高内类变异性: 类内差异大意味着同一类别中的样本之间的差异可能非常大，这使得模型难以学习到一致的特征表示。
- 原因: 这可能是由于数据采集过程中的噪声、不同条件下的生产过程变异或者数据标注不一致等因素造成的。
- 结果/现象: 这可能导致模型对同一类别的样本产生不同的预测，从而降低分类准确性。
低间类可分性: 类间相似性高意味着不同类别的样本在特征空间中可能非常接近，这使得它们难以区分。
- 原因: 这可能是因为不同类别的异常在外观或形状上非常相似，或者因为用于描述样本的特征不足以区分不同的类别。
- 结果/现象: 这可能导致模型将不同类别的样本误分类，从而降低模型的总体性能。

类别不平衡: 在实际应用中，某些异常类型可能比其他异常类型更为常见，导致类别不平衡。
- 原因: 这可能是因为某些类型的异常在生产过程中更容易发生，或者因为数据采集过程中对某些类型的异常进行了更多的关注。
- 结果/现象: 类别不平衡可能导致模型对占多数的类别过度拟合，而忽略占少数的类别，从而降低模型对少数类别的分类性能。

特征学习困难: 高内类变异性和低间类可分性使得模型难以学习到区分不同类别的有效特征。
- 原因: 这可能是因为模型的容量不足，或者因为使用的特征提取方法不适合这种类型的数据。
- 结果/现象: 这可能导致模型在测试数据上的性能不佳，特别是当测试数据包含训练数据中未见过的变异时。

通过解决这些挑战，可以提高模型的性能，提高异常检测的准确性和可靠性，最终提升生产过程的质量和效率。

数据稀缺: 数据集规模小意味着每个类别的样本数量有限，特别是对于数量极少的类别。
- 原因: 这可能是由于数据采集困难、成本高昂或者某些异常类型发生频率低等因素造成的。
- 结果/现象: 数据稀缺可能导致模型过拟合，学习到的特征表示可能不够泛化，对未见过的数据表现不佳。
标签稀缺: 标签数量有限意味着训练数据中可用于学习的信息有限。
- 原因: 这可能是因为专家标注成本高昂，或者某些异常类型难以识别和标注。
- 结果/现象: 标签稀缺可能导致模型学习不足，难以捕捉到数据中的复杂模式。

类别不平衡: 少量类别的样本数量极少，导致类别极度不平衡。
- 原因: 这可能是因为某些异常类型本身就很罕见，或者数据采集过程中对它们的关注不足。
- 结果/现象: 类别不平衡可能导致模型对多数类别过度拟合，而忽略少数类别，降低模型对少数类别的分类性能。

模型选择和调整困难: 在数据稀缺和标签稀缺的情况下，选择合适的模型并进行调整变得更加困难。
- 原因: 这可能是因为有限的数据不足以支持复杂模型的训练，或者因为模型的超参数空间庞大，难以找到最优配置。
- 结果/现象: 这可能导致模型性能不稳定，对超参数选择过于敏感。