自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(106)
  • 收藏
  • 关注

原创 2026.2.8周报

本文研究了量子长短期记忆网络(QLSTM)在时间序列预测中的表现。QLSTM通过变分量子电路替代经典LSTM中的神经网络层,实验表明其在参数相近时收敛更快、更稳定。作者改进了量子自注意力机制,增加了量子比特数和特化损失函数,在分钟级数据上取得优于经典iTransformer的结果,但存在梯度消失和计算成本高的问题。量子相位估计问题也被引入,探讨了酉算子特征值的相位计算。研究表明量子方法能提升模型性能,但仍需优化电路设计以降低计算复杂度。

2026-02-08 01:07:16 707

原创 2026.2.1周报

本文提出了一种新型量子神经网络架构iQTransformer,用于多变量时间序列预测。该模型将量子自注意力机制集成到iTransformer框架中,利用量子纠缠特性高效捕捉变量间复杂依赖关系。实验结果表明,iQTransformer在Lorenz和ITER数据集上,能以更少参数和更快收敛速度达到与经典模型相当的预测精度。文章还系统评估了多种变分量子线路(VQC)的多变量适应策略,为量子时序预测提供了新思路。当前局限包括未考虑真实量子设备的噪声影响,以及经典模拟的计算成本问题。这项工作为量子机器学习在多变量时

2026-02-01 19:40:12 618

原创 2026.1.25日周报

文献阅读和实验复现。文献部分介绍了Wang等人在《Atmosphere》期刊提出的SimVP-GMA模型,该模型通过Group-Mix Attention机制和SCConv空间编码器改进短临降水预报性能,实验表明其在MSE和LPIPS指标上优于现有方法。实验部分复现了量子神经网络(QNN)风速预测项目,尝试应用于降雨预测但效果不佳,需调整实验思路。模型包含两种量子电路结构,采用PennyLane框架实现特征映射和变分层处理。

2026-01-25 20:34:30 726

原创 2025.12.14日周报——文献阅读

本文提出了一种基于纯量子神经网络的短期风速预测模型,通过处理巴西巴伊亚州多地区气象数据,验证了其在RMSE、Pearson相关系数和Fac2指标上的竞争力。研究发现浅层量子电路即可有效学习数据分布,且模型在不同气候区域表现出良好泛化能力。虽然当前研究基于经典模拟器,但为量子机器学习在能源领域的应用提供了实证基础。未来需在真实量子设备测试并扩展对比模型范围。

2026-01-25 16:17:03 841

原创 2026.1.18周报:降雨预测文献阅读

本文提出了一种基于深度学习的多模式降水预报融合方法,通过结合LSTM和注意力机制,构建了LSTM-A和A-LSTM两种模型框架。在雅砻江流域的验证表明,该方法显著提升了长预见期降水预报精度,尤其在高强度降水预报和水文径流模拟中表现优异。与传统方法相比,LSTM-A模型在所有降水强度下均保持较好预报能力,径流预报NSE均大于0.82。但该方法对极高值降水预报仍有改进空间,且目前未考虑预报不确定性,未来需进一步优化。

2026-01-15 12:32:12 730

原创 2024.1.11周报:文献阅读

本文系统综述了基于深度学习的降水临近预报方法,从时间序列预测角度将现有模型划分为递归策略(逐步预测)和多重策略(直接预测)两大类,并细分为非对抗、对抗、U-Net、扩散模型和Transformer等子类。研究通过Moving MNIST和SEVIR数据集评估了不同模型性能,发现对抗生成和扩散模型在高强度降水预测中表现更优,而Transformer在长程依赖捕捉上更具优势。文章指出当前面临长时效预报、多源数据融合和极端事件预测等挑战,建议未来结合物理约束开发更有效的模型。该研究为降水临近预报领域提供了技术框架

2026-01-11 11:03:58 1018

原创 2026.1.4日周报

本文提出卷积LSTM(ConvLSTM)网络用于降水临近预报。传统FC-LSTM处理图像序列时会丢失空间信息,而ConvLSTM通过将全连接操作替换为卷积操作,能够同时建模时空相关性。网络采用编码器-预测器结构,通过多层ConvLSTM堆叠实现序列到序列的预测。实验表明,在Moving MNIST和真实雷达数据上,ConvLSTM在预测准确率和时空特征保持方面均优于FC-LSTM和传统方法。该模型为时空序列预测提供了新思路,但存在长时预测模糊和计算开销大的不足。

2025-12-27 22:54:40 804

原创 2025.12.21论文阅读

摘要: 本文探讨了量子计算在天气和气候预测中的应用潜力。通过介绍量子比特、叠加态和纠缠等基本原理,作者分析了量子算法求解非线性微分方程的能力,并以简单非线性模型为例验证了量子求解器的有效性。研究发现,量子求解器在15步积分内与经典方法和解析解高度一致,且其输出更接近经典系综平均结果,可能天然具备不确定性处理优势。然而,量子计算存在数据读取瓶颈和噪声问题,短期内难以替代经典计算机,但可能通过噪声模拟大气随机过程。未来需开发高效量子算法并研究量子-经典混合路径。 (150字)

2025-12-18 18:00:16 1090

原创 2025.11.30周报——文献阅读

本文探讨了量子机器学习(QML)在天气预报中的应用,通过构建量子神经网络(QNN)模型预测温度和风速,并与经典循环神经网络(RNN)进行对比。实验结果表明,QNN在1层强纠缠架构的温度预测和3层纠缠架构的风速预测中表现优于RNN,尤其在处理数据突变和复杂模式时展现出更强的适应性和鲁棒性。然而,QNN性能受网络深度和纠缠策略影响较大,且存在地理数据局限性和架构敏感性问题。未来研究可优化QNN架构,扩大地理区域验证,并整合高分辨率数据以提升极端天气预测能力。

2025-11-30 19:53:55 978

原创 最优传输理论学习(1)+PINN文献阅读

最优传输理论研究如何以最小成本将一个质量分布转换为另一个质量分布。其核心问题包括Monge问题和Kantorovich问题: Monge问题寻找确定性映射T,将μ中的质量一对一搬运到ν,但限制严格,可能存在无解情况(如狄拉克分布到高斯分布)。 Kantorovich问题通过松弛化,引入联合分布π允许质量拆分运输(一对多),以更灵活的方式优化总成本,确保解的存在性。 应用上,最优传输理论为WGAN等模型提供了数学基础,通过距离度量(如Wasserstein距离)提升生成模型的稳定性。质量守恒和成本函数是核心要

2025-10-25 20:24:14 1054

原创 2025.10.19——PINN文献阅读

在河网水动力过程研究中,数值模拟是研究常用方法,但存在计算复杂、数据处理等问题。随着计算技术发展,一维水动力模型虽能模拟河网非恒定流,但计算需求有时较高。传统的机器学习算法发展为物理系统建模有着很大的帮助,计算效率高,但存在缺乏物理可解释性、等问题。物理信息神经网络(PINNs)将物理定律引入机器学习,在解决物理的偏微分方程方面有非常大的作用,但目前的PINNs用于河流水动力建模的研究非常有限,特别是在复杂河网的全面应用方面更是少之又少,因此本篇论的目的就是在探索将PINNs应用于河网非恒定流建模,作者过增

2025-10-23 16:50:17 1773 1

原创 量子计算学习笔记

本文系统介绍了量子计算的核心原理与数学基础。量子比特利用叠加态实现并行计算,其状态由复数概率幅描述,遵循量子力学的三大基本假设:量子态空间、幺正演化和复合系统张量积。量子计算的关键特性包括量子并行性、纠缠态和可逆运算,通过量子干涉实现高效算法(如Shor算法和Grover搜索)。然而量子退相干效应是主要挑战,需在远小于退相干时间内完成运算。这些原理为量子算法设计提供了理论基础,也指明了未来量子纠错技术的发展方向。

2025-09-21 13:31:06 1452 1

原创 2025.7.27文献阅读-基于深度神经网络的半变异函数在高程数据普通克里金插值中的应用

普通克里金是常用的空间插值方法,其半变异函数的拟合效果对插值精度有显著影响。常用的半变异函数模型有高斯、球形和指数模型,一般需手动比较和调整参数来选择最优模型。现有的半变异函数拟合方法存在手动分析选择模型和受所选模型限制的问题。为减少手动选择模型的繁琐过程,提高拟合优度,本文提出用DNN模拟半变异函数进行插值。本文提出了一种基于深度神经网络和普通克里金的空间插值新方法。通过Python的Keras建立DNN模型拟合半变异函数,以高程数据为案例研究。

2025-07-23 19:12:43 1164

原创 2025.5.11机器学习笔记:PINN文献阅读

本周阅读的文献探讨了物理信息神经网络(PINN)在求解圣维南方程(SVE)和平流-扩散方程(ADE)及其耦合方程中的应用。传统数值方法在处理这些问题时面临不连续性、数值误差和计算成本高等挑战,而PINN通过无网格离散化和处理噪声数据的能力,展现出显著优势。研究构建了PINN模型,在不同初始和边界条件下求解相关方程,并与解析或数值解进行对比,验证了其准确性和效率。实验结果表明,PINN在处理少量数据和复杂几何条件时优于传统方法,且在含噪声数据的反问题求解中表现良好。此外,PINN无需时间步迭代,能同时模拟流场

2025-05-09 15:14:05 1126

原创 2025.4.27机器学习笔记:文献阅读

传统数值算法求解浅水方程时,依赖复杂的网格离散化,计算成本高,且无法预测任意时间点的解。数据驱动的机器学习方法虽在多领域取得进展,但在复杂领域尤其是数据稀缺场景下应用受限。且传统机器学习算法未充分利用先验知识,导致算法泛化能力较低。因此本文提出一种改进的PINN算法求解浅水方程,算法基于PINN和LSTM模型,在损失函数中引入L1正则化项作为惩罚,并在LSTM网络结构中加入注意力机制。通过一维浅水方程模拟实验,与经典PINN算法对比,结果表明改进算法在捕捉细节和处理复杂现象等方面优势显著,虽增加了计算成本,

2025-04-23 13:17:24 1243

原创 2025.4.20机器学习笔记:文献阅读

随着城市化加速,城市洪涝防治对高精度洪水预报需求迫切。当前模型分为物理机制驱动与数据驱动两类:传统水文模型依赖精确地理数据且计算复杂;数据驱动模型虽效率高,但神经网络需要大量洪水时序数据,而实际洪灾事件稀少导致样本不足,易引发过拟合问题。针对TimeGAN在洪水场景的应用局限,本文提出新型双注意力数据增强网络TW-TimeGAN。该模型创新融合Transformer架构与Wasserstein距离损失函数,有效解决梯度异常问题,提升长期序列预测稳定性;通过特征-时间双注意力机制与RNN结合,增强了对降雨径流

2025-04-17 19:17:02 882

原创 2025.4.13机器学习笔记:文献阅读

河流在环境变化中有着重要的作用,且坝的形成水流与河床几何形态相互作用影响,因此理解二者关系对掌握河流物理过程至关重要。虽通过实际观测、模型实验、理论分析和数值模拟等方法对沙坝的形成和发展有了一定认识,但洪水期沙坝形成过程中的水流测量困难,导致对水流与河床相互作用的理解不足。本文提出利用物理信息神经网络结合浅水方程和质量守恒定律,以稀疏的流速和水位数据为训练数据,对交替沙坝上的复杂河流流量进行预测。实验结果表明,该方法能在无直接训练数据的情况下估算水深、河床高程和糙率系数,且训练数据间隔小于沙坝波长时,数据量

2025-04-11 08:46:46 1502 1

原创 2025.4.6机器学习笔记:文献阅读

河流水位动态对农业、工业和城市基础设施至关重要,准确预测有助于灌溉、供水、排水规划和洪水风险评估等领域的决策制定,尤其在极端天气事件中,实时预测对洪水预报和应急响应至关重要。但传统水动力模型,如HEC - RAS虽能通过求解圣维南方程提供高精度的河流水位模拟,但计算成本高,需要大量参数校准和精细的时空数据,导致实时预报在快速演变的洪水场景中效果不尽人意。而纯数据驱动的深度学习模型,如DNN、RNN、LSTM,缺乏物理可解释性,在应用于动态、未知的河流条件时泛化能力较差。物理信息神经网络(PINN)将物理方程

2025-04-01 16:41:47 995

原创 2025.3.30机器学习笔记:文献阅读

传统机器学习技术虽能作为替代模型进行数值预测,但存在对数据数量和质量的依赖,且在数据稀缺时表现不佳。为解决上述问题,物理信息神经网络(PINN)应运而生,PINN可用于解决正问题和逆问题,且通过自动微分计算导数,是一种无网格求解方法。因为山区河流建模困难,需同时处理渐变流和急变流等复杂情况。虽然PINN有在水动力学中的研究,但该论文发布前尚无针对山区河流的研究。所以这篇论文目的是测试PINN在不同流动类型和复杂河床形状的河流中的预测能力,并与传统的HEC - RAS模型求出的数值解进行比较,评估PINN的性

2025-03-29 23:16:59 953 1

原创 2025.3.23机器学习笔记:文献阅读

河流水质直接影响人类健康、生态系统、生物多样性以及社会和工业需求。准确预测溶解氧(DO)和水温(WT)等关键水质参数,能为决策者提供预警。高质量、高粒度的连续时间序列水质数据稀缺且获取的成本高,导致了数据存在不确定性和缺失值,限制了机器学习的预测技术的实施。传统时间序列数据生成模型难以捕捉数据复杂依赖关系,利用生成对抗网络(GAN)进行年度水时间序列数据生成并提高预测模型准确性的研究较少。本论文旨在探究利用水流量数据辅助生成水质和水量数据,并分析生成数据对深度学习预测模型的影响,以提高河流水质时间序列预测的

2025-03-22 18:56:39 1088

原创 2025.3.9机器学习笔记:文献阅读

洪水每年对全世界造成了巨大的损失,有效的洪水预警是重要防洪方式,但是现有洪水预测方法并不可靠,比如,传统的物理计算方法和数据驱动模型需大量水文和地貌数据,又因为极端洪水事件观测数据有限,这会导致模型的预测不准确。本论文基于时间序列GANs,探究其在洪水时间序列生成及预报中的作用,利用时间序列生成对抗网络进行洪水预测,应用TimeGAN和RTSGAN生成合成洪水时间序列。以中国西江流域为例,实验结果表明TimeGAN能准确高效模拟多站点洪水序列的时空相关性,RTSGAN在长序列时表现更优,且合成数据集可减少常

2025-03-06 21:42:07 1282

原创 2025.3.2机器学习笔记:PINN文献阅读

沿海地区人口增长,人类面临飓风和洪水等自然灾害风险增大。气候变化加剧极端风暴潮、降水及海平面上升,使洪水风险进一步提升,研究潮汐河流动力学对减轻洪灾风险至关重要。按照传统的方法,大规模河流模型是气候变化研究的重要工具,但在模拟局部洪水过程时存在不足。其物理可解释性和网格分辨率低,无法解析洪水泛滥的详细信息;统计和动力降尺度方法,但在河流建模中应用有限。传统线性插值降尺度方法无法解决网格单元内空间变化的水流问题。为解决以上问题,本文提出基于物理信息神经网络的机器学习框架,用于模拟大尺度河流模型在沿海地区的亚网

2025-03-02 12:55:43 1588

原创 2025.2.23机器学习笔记:PINN文献阅读

洪水灾害对世界各地的影响重大,造成了严重的社会和经济问题,洪水防控策略依赖于水文预报模型,而这些模型主要通过数据驱动方法获得。所以模型需要达到期望的精度需要大量物理参数,而这些参数往往难以确获取;且传统的数据驱动模型往往需要可靠且真实的数据保证模型的数值模拟准确性。所以在以上背景研究下,本论文提出了一个基于物理信息神经网络(Physics-Informed Neural Networks,PINNs)的河道水流替代模型,作者总共设计了三个PINNs模型架构A、B、C,通过调节模型的输入与输出参数以探究在不同

2025-02-21 17:13:59 1950 1

原创 2025.2.16机器学习笔记:TimeGan文献阅读

用生成模型生成时间序列数据是一件复杂的事,因为其要求生成模型既要捕捉各时间点特征分布,又要学习变量间的动态关系。在时序数据的生成中,自回归模型虽在序列预测中改进了时间动态性,并非真正的生成模型。此外,将生成对抗网络(GAN)框架直接应用于序列数据,但其未充分利用自回归的先验信息,仅靠标准GAN损失求和不能确保生成模型能有效捕捉训练数据中的多步依赖关系。为了解决以上问题,论文作者提出一种时间序列生成对抗网络(Time - GAN),该网络弥补了上述两种模型的缺陷,作者设计了一个包含嵌入函数、恢复函数、序列生成

2025-02-16 17:33:02 4289 3

原创 2025.2.9机器学习笔记:PINN文献阅读

PINN是一种结合了深度神经网络和现代高性能计算技术的方法,其可以用来求解复杂的非线性偏微分方程。虽然PINN有很多优点,比如能够处理复杂的方程,但在需要多次计算或实时模拟的情况下它的训练过程很慢。此外,PINN的结构通常比较复杂,参数太多,导致计算效率不高。传统的数值方法虽然也能解决这些问题,但计算量非常大。为了解决PINN的这些缺点,这篇论文提出了一种新的方法,叫做生成式预训练PINN(GPT-PINN)。GPT-PINN的核心思想是简化网络结构,减少计算量。GPT-PINN的外部结构非常简单,只有一个

2025-02-08 03:49:42 2130

原创 2025.1.26机器学习笔记:C-RNN-GAN文献阅读

生成对抗网络(GANs)目的是生成数据,而循环神经网络(RNNs)常用于生成数据序列。目前已有研究用RNN进行音乐生成,但多使用符号表示。本论文中,作者研究了使用对抗训练生成连续数据的序列可行性,并使用古典音乐的midi文件进行评估。作者提出C-RNN-GAN(连续循环生成对抗网络)这种神经网络架构,用对抗训练来对序列的整体联合概率建模并生成高质量的数据序列。通过在古典音乐midi格式序列上训练该模型,并用音阶一致性和音域等指标进行评估,以验证生成对抗训练是一种可行的训练网络的方法,提出的模型为连续数据的生

2025-01-26 02:47:04 1826

原创 2025.1.12机器学习笔记:GAN文献阅读

本周阅读了GAN的奠基论文,对GAN进行更加深入的理解,为后续要研究使用TimeGAN做时序数据的增强做理论知识的准备。深度学习在判别模型方面取得了显著成功,但深度生成模型的表现在当时的表现还是非常一般的,这是因为在直接构造分布函数的时候,计算最大似然值的过程往往是非常困难的。为了避开这些困难,作者提出了一种新的生成对抗模型框架,即通过生成器(Generator)和辨别器(Discriminator)不断的博弈从而使得生成器能够生成高质量的数据。在博弈过程中,生成模型试图生成难以被判别模型区分的数据,判别模

2025-01-12 20:16:17 1282

原创 第二十八周机器学习笔记:PINN求正反解求PDE文献阅读——反问题、动手深度学习

文献主要讲述了作者是如何利用物理信息神经网络(Physics-informed neural networks,PINN)正反解求偏微分方程(PDEs)。首先作者提出在数据量稀缺背景下,多数机器学习技术缺乏鲁棒性且无法保证收敛,而利用PINN求解相关的偏微分方程可以解决这类问题。。因此,作者在论文中详细讲述了深度学习与物理规定律相结合将物理定律融入神经网络的损失函数中,并提出偏微分方程的数据驱动求解和数据驱动发现两类主要问题展开研究。在研究中,作者根据数据的性质设计了连续时间和离散时间模型,其中,连续时间模

2025-01-05 16:01:18 2907

原创 第二十六周机器学习笔记:PINN求正反解求PDE文献阅读——正问题

本周周报主要详细分析了一篇PINN求正反解的经典文献,文献主要讲述了作者是如何利用PINN正反解求PDE的。之前的深度神经网络在缺乏数据的情况下很容易发生过拟合现象且缺乏鲁棒性。相比较之下,PINN的优势在处理这些问题时,就只需要少量的训练数据就可以训练出一个精确度较高的预测模型。其中,PINN的核心思想是通过在损失函数中构造物理规律的残差项,来对网络的预测值进行限制,然后再通过自动微分、反向传播技术使其不断优化模型,最终使得深度神经网络的预测的值即有精度的同时又符合当下的物理规律。PINN模型它不仅能够进

2024-12-22 20:32:18 2505

原创 第二十五周机器学习笔记:卷积神经网络复习、动手深度学习—线性回归、感知机

本周的周报主要对机器学习的核心概念和实践应用进行了复习和学习,本周复习了神经卷积网络(CNN)的基础知识,包括CNN的工作原理、卷积层、池化层以及它们在图像识别中的应用。在动手深度学习中,学习了了线性回归、softmax回归和多层感知机(MLP)的基本概念和实现,并通过代码示例展示了如何使用PyTorch框架来实现这些模型。此外,还讨论了过拟合问题及其解决方案,如权重衰减和丢弃法,并以Kaggle房价预测竞赛为例,展示了如何将这些概念应用于实际问题中。

2024-12-13 15:27:33 1479 1

原创 第二十四周机器学习笔记:动手深度学习之——统计学习知识

本文详细介绍了统计学习中的基本概念和算法,包括监督学习和无监督学习的区别、线性回归模型、K-means聚类算法、决策树、集成学习(包括Boosting和Bagging)以及贝叶斯定理及其在机器学习中的应用。

2024-12-08 19:35:17 1083

原创 第二十三周机器学习笔记:动手深度学习之——微积分

本文深入探讨了深度学习中的数学基础,特别是微积分在优化和泛化中的作用。文章首先回顾了微积分的历史和基本概念,包括逼近法、导数、微分和积分。接着,文章详细讨论了深度学习中的优化问题,包括损失函数的最小化和模型的泛化能力。文章还介绍了自动微分技术,这是深度学习框架中用于加速求导过程的关键技术。最后,文章通过一系列示例,展示了如何使用自动微分技术来计算梯度,包括非标量变量的反向传播、分离计算以及处理Python控制流的梯度计算。本文为读者提供了一个全面的深度学习数学基础概览,以及如何在实际应用中应用这些概念。

2024-11-29 21:45:13 1011

原创 第二十二周机器学习笔记:动手深度学习之——线性代数

本文深入探讨了深度学习中的数学基础,特别是线性代数的核心概念。文章从标量、向量、矩阵和张量的定义和性质出发,逐步介绍了它们在深度学习中的应用。通过详细的代码示例和数学公式,本文展示了如何进行基本的算术运算、矩阵操作、点积、范数计算等关键操作。文章还讨论了降维技术,包括求和和平均值计算,以及它们在数据压缩和特征提取中的重要性。

2024-11-23 22:10:00 1566

原创 第二十一周机器学习笔记:动手深度学习之——数据操作、数据预处理

本文主要介绍了深度学习的基础知识和操作,包括数据操作、数据运算、数据预处理。最后复习了循环神经网络(RNN)和长短期记忆网络(LSTM)。在数据操作部分,详细讲解了张量的基本操作,如创建、形状调整、元素总数计算、初始化和元素赋值。数据运算部分则包括了张量的算术运算、连结、逻辑运算和求和。文章还介绍了广播机制和索引切片的使用方法。数据预处理部分,通过使用pandas库对CSV文件中的数据进行读取、处理缺失值、转换为张量格式。

2024-11-16 12:11:09 1492

原创 第二十周机器学习笔记:初步认识PINN

本文主要探讨了物理信息神经网络(PINN)的基本概念、工作机制、训练过程,并与传统机器学习模型进行了比较。PINN通过将物理定律嵌入损失函数中,实现了对物理现象的精确模拟和预测,减少了对数据量的依赖,并提高了模型在数据稀缺情况下的预测能力。文章还详细介绍了构建PINN模型的步骤,包括确定问题域和物理定律、选择网络架构、准备数据集、定义损失函数、训练模型、验证和测试模型、调参与优化以及解释和应用。此外,文章通过代码实战比较了RNN、LSTM和Transformer在股市预测中的表现,发现LSTM在这种时序预测

2024-11-10 17:29:40 6665

原创 第十九周机器学习笔记:GAN的数学理论知识与实际应用的操作

本周周报主要围绕生成对抗网络(GAN)的基础知识和理论进行深入探讨。首先回顾了GAN的基本概念、训练原理和应用场景。随后,周报详细分析了GAN背后的理论基础,包括如何通过高维空间中的点来理解图像生成,以及如何通过生成模型来寻找数据的分布。然后周报还描述了最大似然估计(MLE)在生成任务中的应用,并对比了传统方法与GAN的不同。然后复习了训练GAN的过程,包括如何通过判别器(Discriminator)来衡量两个分布之间的差异。最后,我们探讨了GAN的目标函数与JS散度(Jensen-Shannon Dive

2024-11-03 14:28:20 872

原创 第十八周机器学习笔记:生成式对抗网络(下)

本周周报主要对GAN剩下的知识进行了补充学习。周报详细描述了训练GAN存在的难点和训练GAN时的一些技巧,然后还介绍了如何去评估一个GAN的性能的好坏。此外,周报还补充了之前提到的条件型GAN(conditional GAN)。最后,周报通过头像风格迁移引出了Cycle GAN(循环对抗生成网络),并详细描述了其概念原理、应用场景以及其拓展。

2024-10-24 16:50:37 1278

原创 第十七周机器学习笔记:生成式对抗网络(中)

本周周报主要对GAN进行了详细的学习,周报详细介绍了GAN的理论和训练过程,并说明了使用JS散度训练会存在的一些问题。然后周报还详细介绍了WGAN算法替代JS散度的原因和具体方式,并对WGAN算法进行介绍和说明。

2024-10-20 16:55:14 1093

原创 第十六周机器学习笔记:Pointer Network(指针网络)、生成式对抗网络(上);Pytorch学习——完整的模型验证套路

本周周报在机器学习的理论内容中,简单的介绍了Pointer Network 的运作原理,此外还详细描述了GAN,剖析了其内部结构,然后对其中的Generator 和 Discriminator的运作原理以及它们的互动方式进行简要的描述,最后还介绍了GAN的应用案例。在Pytorch的代码实践中,周报详细讲述了如何对模型进行验证的方法。此外,周报在最后还介绍了如何在GitHub上通读项目。

2024-10-13 15:22:56 1566

原创 第十五周机器学习笔记:各式各样神奇的自注意力机制;Pytorch学习——完整的模型训练套路(下)、利用GPU训练;数学拓展——通过矩阵运算加速self-attention的过程

本周周报在机器学习的理论内容中,详细描述了attention matrix计算的各种优化形式,其中包括用人类自身的理解而诞生的Local Attention、Stride Attention、Global Attention、Clustering,也有通过机器自身通过学习而诞生Sinkhorn Sorting Network,最后还有简化attention matrix格式的Linformer。此外,周报在Pytorch学习中还补充了模型训练的细节和描述了如何利用GPU训练的过程。最后,在数学拓展部分,对s

2024-10-05 20:24:47 1387 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除