自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 数据挖掘入门-Task04-建模调参总结

建模调参目标了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程内容:1、线性回归模型:线性回归对于特征的要求;处理长尾分布;对标签进行了 ????????????(????+1) 变换,使标签贴近于正态分布理解线性回归模型;2、模型性能验证:评价函数与目标函数;交叉验证方法;通常并不会把所有的数据集都拿来训练,而是分出一部分来(这一部分不参加训练)对训练集...

2020-03-31 20:46:08 415

原创 数据挖掘入门-Task03-特征工程总结

2、特征工程(最重要的一环)目标对于特征进行进一步分析,并对于数据进行处理内容:常见的特征工程:1、异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;2、特征归一化/标准化:标准化(转换为标准正态分布);归一化(转换到 [0,1] 区间);针对幂律分布,可以采用公式:????????????[(1+????)/( 1 + ????????????????????????...

2020-03-28 20:57:27 307

原创 数据挖掘入门-Task02-EDA:数据探索分析总结

EDA:数据探索性分析0 一般问题评价指标说明0.1评估指标即是我们对于一个模型效果的数值型量化。(有点类似与对于一个商品评价打分,而这是针对于模型效果和理想效果之间的一个打分)0.2分类算法常见的评估指标如下:二类分类器/分类算法评价指标主要有accuracy, [精准率(Precision)和召回率(Recall),F-score,Pr曲线],ROC-AUC曲线多类分类...

2020-03-24 17:55:05 315

原创 《动手学习深度学习》之六:刷分作业FashionMNIST数据集分类-打卡4

FashionMNIST分类首先确认了数据集的图片shape均为:1x28x28,大多数数据集的图片尺寸是不一的,但FashionMNIST是固定的,这省下了很多清洗的工作;然后选择一个模型作为baseline,根据数据集的这样一个规模以及分辨率,肯定不适合用大模型,层数打算控制在20以内,所以我打算尝试一下resnet18作为baseline,然后使用图像增广和批量归一化来改善模型性能。1....

2020-03-01 23:08:27 597

原创 《动手学习深度学习》之四、五:CV方向、案例-打卡3

伯禹课程第三次打卡(CV方向):《动手学习深度学习》之四:CV方向(图像增广、模型微调、图像风格迁移)(打卡3.1)《动手学习深度学习》之五:CV案例(案例1:Kaggle CIFAR-10 图像分类竞赛与案例2:Kaggle Dog Breed Identification 图像分类竞赛)(打卡3.2)...

2020-02-25 18:03:00 229

原创 《动手学习深度学习》之四:CV方向(图像增广、模型微调、图像风格迁移)(打卡3.1)

CV方向1.图像增广1.1.概念1.1.1.大规模数据集是成功应用深度神经网络的前提1.1.2.图像增广(image augmentation)技术通过对训练图像做一系列随机改变,来产生相似但又不同的训练样本,从而扩大训练数据集的规模1.1.3.另一种解释是,随机改变训练样本可以降低模型对某些属性的依赖,从而提高模型的泛化能力。1.2.准备工作1.2.1.首先,导入实验所需的包或模块...

2020-02-25 17:58:59 1028

原创 《动手学习深度学习》之五:CV案例(案例1:Kaggle CIFAR-10 图像分类竞赛与案例2:Kaggle Dog Breed Identification 图像分类竞赛)(打卡3.2)

CV案例1.案例1:Kaggle CIFAR-10 图像分类竞赛1.1.导入包和模块# 可以在Kaggle访问:# https://www.kaggle.com/boyuai/boyu-d2l-image-classification-cifar-10import numpy as npimport torchimport torch.nn as nnimport torch.op...

2020-02-25 17:55:51 1020

原创 《动手学习深度学习》之三:3.RNN循环神经网络(进阶)-4种模型(打卡2.6)

RNN循环神经网络(进阶)1.GRU(门控)模型1.1.概念1.1.1.RNN存在的问题:梯度较容易出现衰减或爆炸(BPTT)1.1.2.GRU⻔控循环神经⽹络:捕捉时间序列中时间步距离较⼤的依赖关系重置⻔有助于捕捉时间序列⾥短期的依赖关系;更新⻔有助于捕捉时间序列⾥⻓期的依赖关系。1.2.GRU模型从零实现1.2.1.载入数据集import numpy as npim...

2020-02-19 20:00:07 335

原创 《动手学习深度学习》之二、三:机器语言模型、卷积神经网络CNN、循环神经网络RNN-打卡2

《动手学习深度学习》之二:1.机器翻译-伯禹课程打卡2.1《动手学习深度学习》之二:2.注意力机制和Seq2seq模型-伯禹课程打卡2.2)《动手学习深度学习》之二:3.Transformer模型-伯禹课程打卡2.3...

2020-02-19 18:03:31 213

原创 《动手学习深度学习》之三:2.卷积神经网络(CNN)进阶-5种模型(打卡2.5)

卷积神经网络(CNN)进阶2.LeNet、AlexNet、VGG、NiN、GooLeNet 5种模型2.1.LeNet2.1.1.全连接层和卷积层的比较:使用全连接层的局限性:• 图像在同一列邻近的像素在这个向量中可能相距较远。它们构成的模式可能难以被模型识别。• 对于大尺寸的输入图像,使用全连接层容易导致模型过大。使用卷积层的优势:• 卷积层保留输入形状。• 卷积层通过滑动...

2020-02-19 17:55:46 477

原创 《动手学习深度学习》之三:1.卷积神经网络(CNN)基础(打卡2.4)

卷积神经网络(CNN)1.卷积神经网络基础1.1.基础概念1.1.1.卷积层1.1.2.填充、步幅、输入通道、输出通道的含义1.1.3.池化层1.1.4.二维互相关运算二维互相关(cross-correlation)运算的输入是一个二维输入数组和一个二维核(kernel)数组,输出也是一个二维数组,其中核数组通常称为卷积核或过滤器(filter)。import torch i...

2020-02-19 17:10:27 493

原创 《动手学习深度学习》之二:3.Transformer模型(打卡2.3)

3.Transformer模型3.1.CNN与RNN的缺点:1.CNNs 易于并行化,却不适合捕捉变长序列内的依赖关系。2.RNNs 适合捕捉长距离变长序列的依赖,但是却难以实现并行化处理序列3.2.为了整合CNN和RNN的优势,创新性地使用注意力机制设计了Transformer模型3.2.1.该模型利用attention机制实现了并行化捕捉序列依赖,并且同时处理序列的每个位置的toke...

2020-02-18 18:31:19 552

原创 《动手学习深度学习》之二:注意力机制和Seq2seq模型(打卡2.2)

2.注意力机制和Seq2seq模型2.1.注意力机制2.1.1.概念2.1.2.框架•不同的attetion layer的区别在于score函数的选择,在本节的其余部分,我们将讨论两个常用的注意层 Dot-product Attention 和 Multilayer Perceptron Attention;随后我们将实现一个引入attention的seq2seq模型并在英法翻译语料...

2020-02-18 17:43:44 358

原创 《动手学习深度学习》之二:机器翻译(打卡2.1)

Task04机器翻译和数据集机器翻译定义:将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。基本结构:Encoder-Decoderencoder:输入到隐藏状态decoder:隐藏状态到输出通常应用在对话系统、生成式任务中EncoderDecod...

2020-02-17 17:50:53 494

原创 《动手学习深度学习》之一:线性回归、softmax与分类模型、多层感知机-伯禹课程-打卡1

深度学习1.01-线性回归1.1.线性回归的基本要素1.1.1.模型线性回归假设输出与各个输入之间是线性关系: y = W.T X + b1.1.2.数据集在机器学习术语里,该数据集被称为训练数据集(training data set)或训练集(training set),一栋房屋被称为一个样本(sample),其真实售出价格叫作标签(label),用来预测标签的两个因素叫作特征(...

2020-02-14 20:22:35 575

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除