自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 transformer attention注意力理解 QKV含义深度探索

此处为b站学习视频记录现在给出一个人的腰围为57, 想要预测他的体重,自然的,因为体重57在56和58之间,所以我们推断其体重在43~48之间但是我们还需要定量计算体重预测值,怎么办呢?我们可以根据57和56,57和58的相似程度来给56对应的体重43和58对应的体重48赋予权重,再求和得到预测值。由于57到56、58的距离一样,所以一种方法是取它们对应的体重的平均值。因为57距离56、58最近,我们自然会非常“注意”他们,所以我们分给他们的注意力权重各为0.5。

2024-01-17 12:43:28 968

原创 李沐动手学深度学习笔记思维导图1—手撕softmax回归代码逻辑

2024-01-17 10:28:06 401

原创 normalization in nn (batchnorm layernorm instancenorm groupnorm)

γβ首先导入pytorch。定义输入,本文以nlp或时间序列预测的数据结构为例。即[batch_size, time_step, embedding]下面为pytorch官方的解释。

2024-01-17 10:27:24 840

原创 2025山大软件学院机器学习805 2024持续押中

贝叶斯决策论、参数化估计方法、非参数化估计方法、朴素贝叶斯分类器、半朴素贝叶斯分类器、 贝叶斯网、EM算法等。神经元模型、感知机与多层网络、误差逆传播算法、全局最小与局部极小、 其他常见神经网络、深度学习等。线性回归、对数几率回归、线性判别分析、多分类学习、类别不平衡问题、基于梯度的优化方法等。间隔与支持向量、对偶问题、核函数、软间隔与正则化、支持向量回归、 核方法等。k近邻学习、低维嵌入、主成分分析、核化线性降维、流形学习、度量学习等。聚类任务、性能度量、距离计算、原型聚类、密度聚类、层次聚类等。

2024-01-16 14:51:32 631 4

原创 SVR, adaboost, MLP, GBDT, XGBOOST, LIGHTGBM以及随机森林模型参数优化+模型训练+shap解释

传递最优模型,进行shap解释。代码缺失train函数,SX。定义optimizim函数。定义参数空间和模型选择函数。使用多数投票法选取最优模型。首先定义object函数。

2024-01-16 14:49:15 1115 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除