缘起性空、-CSDN博客

原创 BERT：基于TensorFlow的BERT模型搭建中文问答任务模型

【代码】基于TensorFlow的BERT模型搭建中文问答系统模型。

2024-02-28 19:20:34 1781 12

原创 TextCNN：文本分类卷积神经网络

TextCNN 来源于发表于2014年，是一个经典的模型，Yoon Kim将卷积神经网络CNN应用到文本分类任务，利用多个不同size的kernel来提取句子中的关键信息（类似统计语言模型的N-Gram），从而能够更好地捕捉局部相关性。TextCNN的核心思想是将卷积神经网络 (CNN) 应用到文本分类中，从而提取文本特征。本文将逐步对TextCNN做详细介绍。优点：网络结构简洁：TextCNN的网络结构相对简单，这使得模型容易理解和实现。训练速度快。

2024-02-22 15:37:31 6159

原创 Google：Gemini 1.5跨数百万上下文令牌解锁多模态理解技术报告（中文）

Gemini 1.5 Pro 是一个基于稀疏混合专家（MoE）转换器的模型，建立在 Gemini 1.0（GeminiTeam et al.,2023）研究进展和多模态能力。转换成真实世界的数据，这种上下文长度使 Gemini 1.5 Pro 模型能够轻松处理几乎一天的音频记录（即 22 小时），是 1440 页的书籍（或 587，287 个单词）“战争与和平”整体的十倍以上，整个亚麻（Heek et al.,2023）代码库（41，070 行代码），或每秒 1 帧的三小时视频。

2024-02-19 18:06:03 1342

原创 OpenAI：Sora视频生成模型技术报告（中文）

我们探索视频数据生成模型的大规模训练。具体来说，我们在可变持续时间、分辨率和宽高比的视频和图像上联合训练文本条件扩散模型。我们利用transformer架构，在视频和图像潜在代码的时空补丁上运行。我们最大的模型Sora能够生成一分钟的高保真视频。我们的结果表明，缩放视频生成模型是构建物理世界通用模拟器的一条有希望的道路。

2024-02-18 09:23:15 3585 2

原创详解Keras3.0 Layer API: Base RNN layer

【代码】详解Keras3.0 Layer API: Base RNN layer。

2024-02-01 17:34:24 587

原创深度学习模型：GAN（生成对抗网络）

通过最小化生成器的损失函数和最大化判别器的损失函数，可以实现生成器和判别器的优化。生成器的目标是生成足够真实的数据以欺骗判别器，而判别器的目标是区分输入数据是真实数据还是生成器生成的伪造数据。首先，固定生成器的参数，训练判别器以更好地区分真实数据和生成数据。然后，固定判别器的参数，训练生成器以生成更真实的数据。训练GAN模型时，需要注意平衡生成器和判别器之间的训练过程，以及选择合适的损失函数和优化器，GAN的训练过程可能不稳定，需要调整超参数和网络结构来获得更好的生成效果。

2024-01-27 07:30:00 6001

原创 Numpy库：常用函数

NumPy是一个用于Python的库，提供大量的函数和工具，用于处理大型多维数组和矩阵，以及进行相关的数学运算。

2024-01-21 17:12:10 1454

原创机器学习算法理论：贝叶斯

机器学习算法理论：贝叶斯

2024-01-17 20:57:03 1618

原创深度学习理论方法：相似度计算

深度学习理论方法：相似度计算

2024-01-14 09:29:14 2087 2

原创机器学习算法理论：线性回归

机器学习算法理论：线性回归

2024-01-13 17:45:41 1138

原创机器学习基本算法：算法流程和算法分类

机器学习基本算法：算法流程和算法分类

2024-01-13 07:30:00 901

原创欠拟合与过拟合

欠拟合与过拟合

2024-01-08 19:00:11 1221

原创 Keras3.0:实现残差连接

【代码】Keras3.0:实现残差连接

2024-01-08 07:00:00 943

原创 AutoKeras

AutoKeras

2024-01-07 18:14:51 1128

原创详解Keras3.0 Callbacks API : TensorBoard（可视化工具）

详解Keras3.0 Callbacks API : TensorBoard（可视化工具）

2024-01-07 07:32:29 999

原创详解Keras:keras.preprocessing.image

Keras 库中的一个模块，用于处理和增强图像数据，它提供了一些实用的函数，如图像的加载、预处理、增强等。用于数据增强的类，可以对图像进行旋转、缩放、平移、翻转等操作。将 numpy 数组或 PIL 图像转换为 PIL 图像。用于加载图像文件，并返回一个 NumPy 数组表示该图像。将图像转换为 NumPy 数组。参数需要与模型输入层的大小相匹。

2024-01-06 21:58:23 2555 2

原创 Keras实现seq2seq

【代码】Keras实现seq2seq

2024-01-05 22:25:18 931

原创自有图片数据制成npz格式数据集

【代码】自有图片数据制成npz格式数据集

2024-01-04 15:22:32 2590 3

原创 Keras内置数据集

Keras内置数据集

2024-01-03 19:53:14 1492

原创详解Keras3.0 Losses:Probabilistic losses(概率损失)

【代码】详解Keras3.0 Losses:Probabilistic losses(概率损失)

2024-01-03 08:58:02 1344

原创实战Keras3.0：自定义图片数据集分类任务

【代码】实战Keras3.0：自定义图片数据集分类任务

2024-01-02 21:59:42 1171

原创 Keras实现Transformer

【代码】Keras实现Transformer模型结构

2024-01-01 11:15:01 1707

原创 Transformer基本结构

Transformer基本结构

2023-12-31 17:05:20 1508

原创 2023年终总结｜回顾学习Tensorflow、Keras的历程

2023年终总结｜回顾学习Tensorflow、Keras的历程

2023-12-31 00:24:38 2235 4

原创 Keras加载预训练模型

Keras库提供了一种方便的方式来加载预训练模型。预训练模型通常是在大型数据集上训练的，如ImageNet，这些模型已经学习到了大量的特征和模式。通过加载预训练模型，我们可以利用这些学到的知识来加速我们的模型训练过程，或者直接使用这些模型来进行预测。

2023-12-30 20:00:32 951

原创详解Keras3.0 Layer API: Dropout layer

Dropout层的作用是在神经网络中引入正则化，以防止过拟合。它通过随机丢弃一部分神经元的输出来减少模型对训练数据的依赖性。这样可以提高模型的泛化能力，使其在测试数据上表现更好。

2023-12-29 20:16:31 1206

原创详解Keras3.0 Layer API: LSTM layer

【代码】详解Keras3.0 Layer API: LSTM layer

2023-12-26 19:27:42 2192 1

原创详解Keras3.0 Layer API: Activation functions(激活函数)

【代码】详解Keras3.0 Layer API: Activation functions(激活函数)

2023-12-25 15:25:47 2564

原创详解Keras3.0 API: Optimizers(优化器)

优化器（Optimizer）是深度学习中用于更新模型参数的一种方法，它的目标是最小化损失函数。在训练神经网络时，我们通常使用梯度下降法来更新参数，而优化器就是实现这一过程的工具。优化器的主要作用是在每次迭代过程中计算损失函数关于模型参数的梯度，并根据梯度的方向和大小来更新参数，从而使得模型逐渐逼近最优解。在使用SGD优化器时，可以设置不同的学习率和动量参数。学习率决定了权重更新的速度，而动量参数则有助于加速梯度下降过程。在实际应用中，可以根据问题的复杂性和数据的特点来选择合适的优化器和参数。

2023-12-24 18:00:54 1918