氟西汀重度患者-CSDN博客

原创数据挖掘入门-Task04-建模调参总结

建模调参目标了解常用的机器学习模型，并掌握机器学习模型的建模与调参流程内容：1、线性回归模型：线性回归对于特征的要求；处理长尾分布；对标签进行了 ????????????(????+1) 变换，使标签贴近于正态分布理解线性回归模型；2、模型性能验证：评价函数与目标函数；交叉验证方法；通常并不会把所有的数据集都拿来训练，而是分出一部分来（这一部分不参加训练）对训练集...

2020-03-31 20:46:08 415

2、特征工程（最重要的一环）目标对于特征进行进一步分析，并对于数据进行处理内容：常见的特征工程：1、异常处理：通过箱线图（或 3-Sigma）分析删除异常值；BOX-COX 转换（处理有偏分布）；长尾截断；2、特征归一化/标准化：标准化（转换为标准正态分布）；归一化（转换到 [0,1] 区间）；针对幂律分布，可以采用公式：????????????[(1+????)/( 1 + ????????????????????????...

2020-03-28 20:57:27 307

原创数据挖掘入门-Task02-EDA:数据探索分析总结

EDA：数据探索性分析0 一般问题评价指标说明0.1评估指标即是我们对于一个模型效果的数值型量化。（有点类似与对于一个商品评价打分，而这是针对于模型效果和理想效果之间的一个打分）0.2分类算法常见的评估指标如下：二类分类器/分类算法评价指标主要有accuracy， [精准率（Precision）和召回率（Recall），F-score，Pr曲线]，ROC-AUC曲线多类分类...

2020-03-24 17:55:05 315

原创《动手学习深度学习》之六：刷分作业FashionMNIST数据集分类-打卡4

FashionMNIST分类首先确认了数据集的图片shape均为：1x28x28，大多数数据集的图片尺寸是不一的，但FashionMNIST是固定的，这省下了很多清洗的工作；然后选择一个模型作为baseline，根据数据集的这样一个规模以及分辨率，肯定不适合用大模型，层数打算控制在20以内，所以我打算尝试一下resnet18作为baseline，然后使用图像增广和批量归一化来改善模型性能。1....

2020-03-01 23:08:27 597

原创《动手学习深度学习》之四、五：CV方向、案例-打卡3

伯禹课程第三次打卡（CV方向）：《动手学习深度学习》之四：CV方向（图像增广、模型微调、图像风格迁移）（打卡3.1）《动手学习深度学习》之五：CV案例（案例1：Kaggle CIFAR-10 图像分类竞赛与案例2：Kaggle Dog Breed Identification 图像分类竞赛）（打卡3.2）...

2020-02-25 18:03:00 229

原创《动手学习深度学习》之四：CV方向（图像增广、模型微调、图像风格迁移）（打卡3.1）

CV方向1.图像增广1.1.概念1.1.1.大规模数据集是成功应用深度神经网络的前提1.1.2.图像增广（image augmentation）技术通过对训练图像做一系列随机改变，来产生相似但又不同的训练样本，从而扩大训练数据集的规模1.1.3.另一种解释是，随机改变训练样本可以降低模型对某些属性的依赖，从而提高模型的泛化能力。1.2.准备工作1.2.1.首先，导入实验所需的包或模块...

2020-02-25 17:58:59 1028

原创《动手学习深度学习》之五：CV案例（案例1：Kaggle CIFAR-10 图像分类竞赛与案例2：Kaggle Dog Breed Identification 图像分类竞赛）（打卡3.2）

CV案例1.案例1：Kaggle CIFAR-10 图像分类竞赛1.1.导入包和模块# 可以在Kaggle访问：# https://www.kaggle.com/boyuai/boyu-d2l-image-classification-cifar-10import numpy as npimport torchimport torch.nn as nnimport torch.op...

2020-02-25 17:55:51 1020

原创《动手学习深度学习》之三：3.RNN循环神经网络（进阶）-4种模型（打卡2.6）

RNN循环神经网络（进阶）1.GRU（门控）模型1.1.概念1.1.1.RNN存在的问题：梯度较容易出现衰减或爆炸（BPTT）1.1.2.GRU⻔控循环神经⽹络：捕捉时间序列中时间步距离较⼤的依赖关系重置⻔有助于捕捉时间序列⾥短期的依赖关系；更新⻔有助于捕捉时间序列⾥⻓期的依赖关系。1.2.GRU模型从零实现1.2.1.载入数据集import numpy as npim...

2020-02-19 20:00:07 335

原创《动手学习深度学习》之二、三：机器语言模型、卷积神经网络CNN、循环神经网络RNN-打卡2

《动手学习深度学习》之二：1.机器翻译-伯禹课程打卡2.1《动手学习深度学习》之二：2.注意力机制和Seq2seq模型-伯禹课程打卡2.2）《动手学习深度学习》之二：3.Transformer模型-伯禹课程打卡2.3...

2020-02-19 18:03:31 213

原创《动手学习深度学习》之三：2.卷积神经网络（CNN）进阶-5种模型（打卡2.5）

卷积神经网络（CNN）进阶2.LeNet、AlexNet、VGG、NiN、GooLeNet 5种模型2.1.LeNet2.1.1.全连接层和卷积层的比较：使用全连接层的局限性：• 图像在同一列邻近的像素在这个向量中可能相距较远。它们构成的模式可能难以被模型识别。• 对于大尺寸的输入图像，使用全连接层容易导致模型过大。使用卷积层的优势：• 卷积层保留输入形状。• 卷积层通过滑动...

2020-02-19 17:55:46 477

原创《动手学习深度学习》之三：1.卷积神经网络（CNN）基础（打卡2.4）

卷积神经网络（CNN）1.卷积神经网络基础1.1.基础概念1.1.1.卷积层1.1.2.填充、步幅、输入通道、输出通道的含义1.1.3.池化层1.1.4.二维互相关运算二维互相关（cross-correlation）运算的输入是一个二维输入数组和一个二维核（kernel）数组，输出也是一个二维数组，其中核数组通常称为卷积核或过滤器（filter）。import torch i...

2020-02-19 17:10:27 493

原创《动手学习深度学习》之二：3.Transformer模型（打卡2.3）

3.Transformer模型3.1.CNN与RNN的缺点：1.CNNs 易于并行化，却不适合捕捉变长序列内的依赖关系。2.RNNs 适合捕捉长距离变长序列的依赖，但是却难以实现并行化处理序列3.2.为了整合CNN和RNN的优势，创新性地使用注意力机制设计了Transformer模型3.2.1.该模型利用attention机制实现了并行化捕捉序列依赖，并且同时处理序列的每个位置的toke...

2020-02-18 18:31:19 552

原创《动手学习深度学习》之二：注意力机制和Seq2seq模型（打卡2.2）

2.注意力机制和Seq2seq模型2.1.注意力机制2.1.1.概念2.1.2.框架•不同的attetion layer的区别在于score函数的选择，在本节的其余部分，我们将讨论两个常用的注意层 Dot-product Attention 和 Multilayer Perceptron Attention；随后我们将实现一个引入attention的seq2seq模型并在英法翻译语料...

2020-02-18 17:43:44 358

原创《动手学习深度学习》之二：机器翻译（打卡2.1）

Task04机器翻译和数据集机器翻译定义：将一段文本从一种语言自动翻译为另一种语言，用神经网络解决这个问题通常称为神经机器翻译（NMT）主要特征：输出是单词序列而不是单个单词。输出序列的长度可能与源序列的长度不同。基本结构：Encoder-Decoderencoder：输入到隐藏状态decoder：隐藏状态到输出通常应用在对话系统、生成式任务中EncoderDecod...

2020-02-17 17:50:53 494

原创《动手学习深度学习》之一：线性回归、softmax与分类模型、多层感知机-伯禹课程-打卡1

深度学习1.01-线性回归1.1.线性回归的基本要素1.1.1.模型线性回归假设输出与各个输入之间是线性关系: y = W.T X + b1.1.2.数据集在机器学习术语里，该数据集被称为训练数据集（training data set）或训练集（training set），一栋房屋被称为一个样本（sample），其真实售出价格叫作标签（label），用来预测标签的两个因素叫作特征（...

2020-02-14 20:22:35 575

EricYoung的博客