Acetering-CSDN博客

原创机器学习笔记4-0：PyTorch教程

*注:本博客参考李宏毅老师2020年机器学习课程. 视频链接目录1 Tensor1.1 Tensor创建1.1.1 从数据创建1.1.2 创建特殊值的Tensor1.1.3 创建指定步长的Tensor1.2 Tensor组合与变换1.2.1 两个Tensor拼接1.2.2 Tensor变形1.2.3 Tensor维度操作1.3 Tensor运算1.3.1 四则运算1.3.2 矩阵乘法与向量内积1.3.3 求导2 网络模型2.1 线性模型2.2 激活函数2.3 模型堆叠2.4 损失函数2.5 优化器Refe

2021-07-20 20:29:23 919

原创机器学习笔记5-5：无监督学习——Auto-encoder

*注:本博客参考李宏毅老师2020年机器学习课程. 视频链接目录1 Auto-encoder基本概念1.1 基本任务1.2 网络结构1.3 Encoder1.4 Auto-encoder起源1.5 De-noising Auto-encoder2 Auto-encoder的应用与延伸2.1 Feature Disentangle2.2 Discrete Representation2.3 Generator2.4 Compression2.5 Anomaly Detection(异常检测)1 Auto

2021-10-06 14:31:18 651

原创机器学习笔记5-4：自监督学习

*注:本博客参考李宏毅老师2020年机器学习课程. 视频链接目录1 自监督学习的概念2 BERT2.1 BERT简介2.2 BERT的使用2.2.1 Sentiment Analysis（情感分析）2.2.2 POS（词性标记）2.2.3 Natural Language Inferencee（NLI，自然语言推论）2.2.4 Extraction-based Question Answering（QA）2.3 BERT的预训练2.4 BERT预训练的原理（猜想）2.5 Multi-lingual BER

2021-10-06 14:29:21 620

原创机器学习笔记5-3：GAN

*注:本博客参考李宏毅老师2020年机器学习课程. 视频链接目录1 Generation Adversarial Network1.1 GAN的工作方式1.2 Generator的特点1.3 Discriminator的特点1.4 “对抗”的进行1.5 GAN的应用2 GAN原理2.1 GAN的目标2.2 WGAN2.3 GAN训练的难点2.3.1 难以训练2.3.2 文字生成2.3.3 Mode Collapse与Mode Dropping2.4 GAN与监督学习3 Generator质量评估3.1 借

2021-09-28 20:58:05 647

原创机器学习笔记5-2：Transformer

*注:本博客参考李宏毅老师2020年机器学习课程. 视频链接目录1 Seq2seq2 Encoder3 Decoder3.1 AT汉字的产生如何输出不定长向量避免一步错，步步错3.2 NAT3.3 Training3.4 Tips3.4.1 Copy Mechanism（复制机制）3.4.2 Guided Attention3.4.3 Beam Search3.4.4 Learning rate scheduling3.4.5 Back-translation（BT）本节可参考原文：Attention

2021-09-28 20:54:16 742

原创机器学习笔记5-1：Self-Attention

*注:本博客参考李宏毅老师2020年机器学习课程. 视频链接目录1 网络的输入与输出类型2 Self-Attention 自注意力机制2.1 计算关联度2.2 soft-max2.3 计算最高关联度2.4 矩阵表示2.5 Self-Attention的学习2.6 进阶：Mutil-Head Self-Attention2.7 位置编码3 Self-Attention的应用3.1 [Transformer](https://arxiv.org/abs/1706.03762)3.2 NLP上的应用3.3 语音

2021-09-25 10:41:12 547 1

原创机器学习笔记5-0：卷积神经网络

*注:本博客参考李宏毅老师2020年机器学习课程. 视频链接目录0 引言1 图像识别的特点1.1 全连接神经网络的缺点1.2 特征的局部性1.3 检测器权值共享1.4 下采样2 CNN2.1 CNN基本结构2.2 卷积运算2.3 卷积与全连接的关系2.4 Max Pooling2.5 Flatten3 PyTorch实现：CNN分类MNIST3.1 网络结构定义0 引言CNN时卷积神经网络的简称，它被广泛用于图像和语音领域，CNN的提出大幅减少了全连接神经网络的参数量，并且性能也比全连接神经网络更高

2021-08-09 15:31:41 521

原创机器学习笔记4-1：手写数字分类实战

*注:本博客参考李宏毅老师2020年机器学习课程. 视频链接目录1 模型构建1.1 模型定义1.2 训练步骤1.3 测试步骤1.4 数据加载1.5 模型初始化1.6 优化器1.7 损失函数1.8 启动训练本章利用前述PyTorch的基本使用方法，来完成一个对MNIST数据集的手写数字图片分类任务。1 模型构建1.1 模型定义首先我们继承torch.nn.Module类，创建一个自定义的网络模型，继承时至少需要重写两个方法：__init__()和forward(x)，前者用于模型初始化，定义模型结

2021-07-22 20:34:31 891

原创机器学习笔记3-1：反向传播算法原理与实现

*注:本博客参考李宏毅老师2020年机器学习课程. 视频链接目录1 反向传播算法数学基础1.1 前向传播1.2 反向传播2 矩阵运算1 反向传播算法数学基础反向传播算法是用于对神经网络中的各个网络参数计算偏导值的一种算法，其核心是链式求导法则。注：本节涉及到较复杂的数学计算，了解思想即可。(图一)在图一中，画出了一个神经网络的前两层结构的部分神经元。图中，xix_ixi表示网络的输入。wijw_{ij}wij表示第i层神经元的参数，j仅用作区分不同的参数。zijz_{ij}zij表示第

2021-07-15 17:57:46 487

原创机器学习笔记3-0：神经网络与深度学习概述

*注:本博客参考李宏毅老师2020年机器学习课程. 视频链接目录1 神经网络1.1 全连接前馈神经名词解释2 深度学习3 深度学习中的典型问题3.1 为什么需要“深度学习”3.2 深层结构的求导问题1 神经网络在逻辑回归任务中，我们使用到的模型是一个函数，其中包含许多参数，最终模型的输出y可以表示为：y=softmax(sigmoid(wx+b))y=softmax(sigmoid(wx+b))y=softmax(sigmoid(wx+b))用图来表示为：(图1)如果将虚线框中的部分用一

2021-07-14 11:14:30 291

原创机器学习笔记2-1：逻辑回归

*注:本博客参考李宏毅老师2020年机器学习课程. 视频链接目录1 逻辑回归1.1 概念1.2 损失函数1.3 梯度下降2 为什么不使用均方差作为损失函数3 多类别逻辑回归3.1 模型调整3.2 Softmax函数4 逻辑回归的局限与解决方案4.1 无法分类的局限4.2 解决方案——特征提取1 逻辑回归1.1 概念从上一节的讨论中，我们发现对一个具有特征值XXX的个体，如果XXX的各分量相互独立，并且每一个XXX也是独立同分布的话，那么对这个个体进行分类，其属于某一个类别的概率f(x)f(x)f(

2021-07-13 18:46:54 169

Acetering的博客

原创机器学习笔记4-0：PyTorch教程

原创机器学习笔记5-5：无监督学习——Auto-encoder

原创机器学习笔记5-4：自监督学习

原创机器学习笔记5-3：GAN

原创机器学习笔记5-2：Transformer

原创机器学习笔记5-1：Self-Attention

原创机器学习笔记5-0：卷积神经网络

原创机器学习笔记4-1：手写数字分类实战

原创机器学习笔记3-1：反向传播算法原理与实现

原创机器学习笔记3-0：神经网络与深度学习概述

原创机器学习笔记2-1：逻辑回归

原创机器学习笔记2-0：分类模型

原创机器学习笔记1-3：误差分析

原创机器学习笔记1-2：优化器

原创机器学习笔记1-1：过拟合

原创机器学习笔记1-0：线性回归

CNN_MNIST.py

PyTorch手写数字识别代码

空空如也