机器学习
文章平均质量分 71
曼城周杰伦
行走在路上的AI工程师
展开
-
NLP面试官:“Attention为什么要除以根号d” 算法女生这么回答当场想发 offer
作者说,当 的值变大的时候,softmax 函数会造成梯度消失问题,所以设置了一个 softmax 的 temperature 来缓解这个问题。这个题目可以说是 NLP 面试中一个高频出现的问题,基本上问到 Attention 或者 Transformers 的时候都会问。这个问题在《Attention is All Your Need》的原始论文中是给出了一个粗略的答案的。这是个好题目,我作为面试官的时候也经常问,因为很快能了解到面试同学的数学功底怎么样。下面来回答一下这两个衍生的问题。原创 2024-06-01 18:19:56 · 453 阅读 · 0 评论 -
对抗训练:提高机器学习模型鲁棒性的关键技术
对抗训练是一种强大的工具,可以帮助我们构建更加安全可靠的人工智能系统。随着对抗样本攻击手段的不断进步,对抗训练技术也在不断发展,以应对新的挑战。原创 2024-05-20 15:25:39 · 1451 阅读 · 0 评论 -
最全总结!十大SVM算法模型!
支持向量机(SVM)能够处理高维数据、非线性可分问题,并且具有良好的泛化能力,被广泛应用于分类、回归和异常检测等领域。每一种模型和变体在不同的问题和数据集上表现出不同的性能和特点,在实际情况中,合适的模型取决于具体的应用场景和数据特征。SVM通过找到最优超平面来划分不同类别的数据,从而实现对数据的有效分类和预测。今天咱们从以下10个方面出发,详细介绍其每种算法模型的核心要点和使用方法。先来简单介绍下支持向量机~原创 2024-05-20 08:38:38 · 241 阅读 · 0 评论 -
Seaborn用法大全
Seaborn是一个基于Python的数据可视化库,它建立在matplotlib的基础之上,为统计数据的可视化提供了高级接口。Seaborn通过简洁美观的默认样式和绘图类型,使数据可视化变得更加简单和直观。它特别适用于那些想要创建具有吸引力且信息丰富的统计图形的数据科学家和数据分析师。原创 2024-05-13 08:51:19 · 1119 阅读 · 0 评论 -
机器学习之SMOTE重采样--解决样本标签不均匀问题
使用SMOTE算法对其中的少数类别进行过采样,以使其与多数类别的样本数量相当或更接近。这个示例中,首先生成一个不平衡的二分类数据集,然后使用SMOTE算法来生成新的合成样本,使得两个类别的样本数量相等。最后原始数据集和平衡后的数据集进行可视化展示。包含了各种常用的不平衡数据处理方法,例如:随机过采样,SMOTE及其变形方法,tom-links欠采样,编辑最近邻欠采样方法等等。仅用正样本的K近邻生成新正样本是正是SMOTE方法,考虑到(SMOTE的最终目的是分清正负样本的边界),所以需要对样本生成进行优化。原创 2024-05-06 17:36:49 · 918 阅读 · 0 评论 -
机器学习之常用的回归预测模型
本文全面整理了各种回归预测模型,旨在帮助读者更好地学习回归预测模型原创 2024-04-04 14:52:46 · 2391 阅读 · 0 评论 -
时间系列预测总结
转载自:https://mp.weixin.qq.com/s/B1eh4IcHTnEdv2y0l4MCog拥有一种可靠的方法来预测和预测未来事件一直是人类的愿望。在数字时代,我们拥有丰富的信息,尤其是时间序列数据。时间序列是指基于时间刻度维度(天、月、年等)采样和组织的任何数据。预测它将提供有价值的见解,帮助我们做出明智的决策并制定业务战略。时序数据示例包括:金融市场:股票价格、汇率和交易量。气候和天气:温度、降雨量和风速。销售和需求预测:一段时间内的产品销售数据。原创 2024-04-08 13:39:35 · 744 阅读 · 0 评论