自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 扩散模型DDPM原来是这么一回事(贝叶斯角度)

关于DDPM的各种理论,网上已经有很多的文章了。之所以还要写这篇文章,主要还是方便自己梳理和复习。也为了后续的扩散相关文章做一下铺垫。如果你还在学习什么是DDPM,只看这篇文章也足够了。【原论文】: Denoising Diffusion Probabilistic Models原论文从ELBO开始推导,其中扩散过程的推导技巧性太强,一般人很难想到用这样的方式。具体推理,可以参考下面这篇文章。

2024-05-09 00:09:06 856

原创 变分推断(Variational Inference,)与证明下界(Evidence Lower Bound, ELBO)

假设我们现在要做一个生成模型,我们只有训练集的数据,要求数据的分布p,我们当然无法直接求。因此一个可行的方法是,找一个容易表达和求解的分布q,只要p和q的分布差异足够小,我们就可以将q作为p的近似分布了,成为我们的输出结果。而求解这个过程的方法,就叫做变分推断。这样的一个思路,我们就可以把一个求分布问题,转变成了“缩小距离”的优化问题。本文在开头,先直白讲解了什么叫做变分推断,以及它的作用。然后从机器学习的生成模型的背景开始,逐步引出变分推断的使用,最后从头到尾推导了,ELBO的由来。

2024-05-02 20:47:22 1140

原创 P-tuning V2论文和代码实现详解

论文题目:P-Tuning v2: Prompt Tuning Can Be Comparable to Finetuning Universally Across Scales and Tasks网上已经有很多关于论文理论的介绍了,这里只简单提一提。P-tuning V2不是一个新东西,它是Deep Prompt Tuning (;)的一个优化和适应实现。与深度提示调整类似,P-tuning v2被设计用于生成和知识探索,但最重要的改进之一是将连续提示应用于预训练模型的每个层,而不仅仅是输入层。

2023-05-27 14:15:21 2613 1

原创 混淆矩阵,P-R曲线和ROC&AUC

这是一篇总结文混淆矩阵混淆矩阵左侧是真实信息,上放是样本预测的信息。所以一个二分类的混淆矩阵为。我们常说的Precision(精确率),Recall(召回率),Accuray(准确率)。就可以从上述计算得来。P=Precision=TPTP+FP(1)\tag{1}P=Precision=\frac{TP}{TP+FP}P=Precision=TP+FPTP​(1)R=Recall=TPTP+FN(2)\tag{2}R=Recall=\frac{TP}{TP+FN}R=Recall=.

2021-10-22 15:50:24 1881

原创 为什么交叉熵的梯度公式跟最小二乘法一样?

引言之前一致不明白,为什么交叉熵损失函数在进行梯度计算的时候的公式跟最小二乘是一致的。抱着这样的疑问,我对交叉熵损失函数进行的偏微分,进行验证。正文最小二乘法损失函数J(θ)=12m∑im(h(xi)−yi)2J(\theta)=\frac{1}{2m}\sum_i^m(h(x^i)-y^i)^2J(θ)=2m1​i∑m​(h(xi)−yi)2此时h(x)=wx+bh(x)=wx+bh(x)=wx+b,所以∂J(θ)∂θj=1m∑im(h(xi)−yi)xji\frac{\partial J(\

2021-10-22 11:58:44 301

原创 为什么交叉熵,极大似然,最小二乘能做损失函数?

最小二乘Loss=1m∑i=1m(f(xi)−yi)2Loss=\frac{1}{m}\sum_{i=1}^m(f(x_i)-y_i)^2Loss=m1​i=1∑m​(f(xi​)−yi​)2极大似然估计法如何做损失函数?什么是极大似然估计法?似然值是指真实的情况已经发生,我们假设事件有很多概率模型,然后根据概率模型计算真实情况发生的概率。这个概率就叫似然值。假设投硬币事件,现实世界投十次硬币,7正三反。我们假设理念世界有三个概率模型,分别为正0.1反0.9正0.7反0.3正0.8反0.

2021-10-19 22:47:43 158

转载 jupyter notebook常用快捷键大全

原文链接方便自己查阅,请读者优先点击原文链接查看# 命令模式 (按键 Esc 开启)# 编辑模式 ( Enter 键启动)命令模式 (按键 Esc 开启)Enter : 转入编辑模式Shift-Enter : 运行本单元,选中下个单元Ctrl-Enter : 运行本单元Alt-Enter : 运行本单元,在其下插入新单元Y : 单元转入代码状态M :单元转入markdown状态R : 单元转入raw状态1 : 设定 1 级标题2 : 设定 2 级标题3 : 设定 3 级标题4

2021-07-26 18:29:39 352

原创 hexo多台电脑更新博客

“You can do it!”请前往我的博客阅读前言正值暑期,回家后,用多了台式机。便想着,如何既能在笔记本上更新博客,也能在台式机上更新博客。且互不冲突。在查阅了相关资料后,有了这篇文章。在此做个记录和分享。阅读该文章的前提条件:会hexo,git以及github的基本使用。文章符号说明:1. [xxx],表示xxx是变量,可以自己取正文首先需要一个用hexo搭建好的博客。如图所示我们的目的是,能在不同的电脑更新hexo博客。也就是说,你既可以在公司电脑更新,也可以在.

2021-07-25 15:42:30 185

原创 关于在numpy张量的变化经常出现的-1作用简述

自动推断在python当中,我们通常用-1,都是指代最后一列。比如列表x=[1,2,3,4]x[-1]==4 #True但是在numpy当中,我们对张量进行变换。-1经常代表自动推断。比如import numpy as npx = np.arange(12).reshape(2,6) # x.shape为(2,6)x = x.reshape(2, 3, -1) #此时自动推断,x的shape为(2,3,2)...

2021-06-01 16:49:33 242

转载 Tomcat绝对路径资源访问问题

该文章是飞升飞博主原创内容原博客地址:链接: 点击跳转原博客地址 最近,在进行web项目开发时,我遇到了一个关于项目前端图片资源访问路径的问题。如果此时将图片资源直接放置在项目内,再使用相对路径访问,问题当然是能够解决,但是随着项目的进行,这样做会导致项目空间不断增大,而且项目的可移植性也会变差,还有安全性的问题。所以,这种方法我们不考虑。 针对自己的个人项目,我在数据库中存放的是图片资源的相对路径,而图片资

2021-02-02 11:15:13 889

原创 mysql-connector-java-8.0.22连接驱动中出现的问题

mysql-connector-java-8.0.22连接出现的问题create connection SQLException, url: jdbc:mysql://localhost:3306/test, errorCode 1045, state 28000The server time zone value '�й���׼ʱ��' is unrecognized or represents more than one time zone. You must configure either the

2020-12-22 19:22:07 3090 1

原创 关于mysql8.0解压版和安装版的安装区别以及解决启动Mysql服务错误1053问题的解决

关于mysql8.0解压版和安装版的安装区别以及解决启动Mysql服务错误1053问题的解决解压版和安装版的区别解压版的安装安装版的安装解决启动Mysql服务错误1053解压版和安装版的区别这里以mysql8.0.22.0为例,解压版相对安装来说,卸载更加的容易,同时可以任意选择自己的安装位置。但是安装方法相应的麻烦了些。解压版的安装链接: link.安装版的安装因为安装版的安装过程非常的小白,这里就不给链接了。一路next就好。解决启动Mysql服务错误1053一般通过解压版安装的my

2020-12-17 12:24:52 908

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除