机器学习
头号大眼睛
这个作者很懒,什么都没留下…
展开
-
Mask_rcnn中文详解
一.在学习Mask之前,建议先看看faster_rcnn,(faster_rcnn代码解读)Mask_rcnn关键技术:1.多尺度检测(最早在yolo3中使用),里面用到了FPN技术2.rpn2.ROI Align二:系统学习mask_rcnn过程,B站视频讲解三:代码中文注释model.py"""Mask R-CNNThe main Mask R-CNN m...原创 2020-03-17 22:37:11 · 1890 阅读 · 0 评论 -
pytorch 模型微调
微调在前面的一些章节中,我们介绍了如何在只有6万张图像的Fashion-MNIST训练数据集上训练模型。我们还描述了学术界当下使用最广泛的大规模图像数据集ImageNet,它有超过1,000万的图像和1,000类的物体。然而,我们平常接触到数据集的规模通常在这两者之间。假设我们想从图像中识别出不同种类的椅子,然后将购买链接推荐给用户。一种可能的方法是先找出100种常见的椅子,为每种椅子拍摄...转载 2020-02-29 09:36:17 · 525 阅读 · 0 评论 -
优化算法
原创 2020-02-25 17:32:52 · 188 阅读 · 0 评论 -
图像迁移
总变差损失有时候,我们学到的合成图像里面有大量高频噪点,即有特别亮或者特别暗的颗粒像素。一种常用的降噪方法是总变差降噪(total variation denoising)。假设xi,jxi,j表示坐标为(i,j)的像素值,降低总变差损失 能...原创 2020-02-25 17:28:41 · 527 阅读 · 0 评论 -
Gan /DCGan 生成对抗网络
GANGan 神经网络来生成数据,可用于训练数据太少,生成伪数据来解决欠拟合问题%matplotlib inlineimport matplotlib.pyplot as pltfrom torch.utils.data import DataLoaderfrom torch import nnimport numpy as npfrom torch.autograd...原创 2020-02-25 17:10:39 · 395 阅读 · 1 评论 -
过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸;循环神经网络进阶
一,过拟合、欠拟合及其解决方案过拟合:模型的训练误差远小于它在测试数据集上的误差欠拟合:模型无法得到较低的训练误差因素:模型复杂度和训练数据集大小训练集数据太少,会引起过拟合,模型越越简单,会引起欠拟合。折中办法是在保证能够训练的情况下,模型尽量复杂,数据量也随之增多机器学习中遇到的方法:正则化:在loss函数中加入,w^2项来强行训练减少loss,在训练的时候限制权值变大...原创 2020-02-17 23:28:14 · 579 阅读 · 0 评论 -
文本预处理,语言模型,循环神经网络
文本预处理文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤:读入文本 分词 建立字典,将每个词映射到一个唯一的索引(index) 将文本从词的序列转换为索引的序列,方便输入模型用现有工具进行分词spaCy,NLTK,jieba。...原创 2020-02-12 20:07:29 · 389 阅读 · 0 评论 -
循环神经网络进阶-------自动写歌词
RNN,LSTM,GRU,循环RNN, 深度LSTM,四个模型自动写杰伦歌词import os import numpy as npimport torchfrom torch import nn,optimimport torch.nn.functional as Fimport sysimport timeimport mathsys.path.append("###"...原创 2020-02-13 22:28:45 · 545 阅读 · 0 评论 -
线性回归 ,softmax,多层感知机
一 线性回归模型最要是描述输入输出的线性关系,例如:房屋价格与房子面积和房子年龄的关系为了简单起见,这里我们假设价格只取决于房屋状况的两个因素,即面积(平方米)和房龄(年)。接下来我们希望探索价格与这两个因素的具体关系。线性回归假设输出与各个输入之间是线性关系:price=warea⋅area+wage⋅age+b二 优化函数 - 随机梯度下降当模型和损失函数形式较为简单时,上...原创 2020-02-11 18:23:58 · 510 阅读 · 0 评论 -
循环神经网络
理解:循环神经网络可以看成是一个过程,通过现在的发生的事情来预测未来发生的事,t时刻的输出由t-1时刻的隐藏层输出Ht-1和t时刻的输入Xt共同决定。(Xt,Ht-1) -----> Yt递归网络问题常规递归网络从理论上应该可以顾及所有过去时刻的依赖,然而实际却无法按人们所想象工作。原因在于梯度消失(vanishinggradient)和梯度爆炸(exploding gra...原创 2020-02-12 19:56:12 · 332 阅读 · 0 评论 -
多层感知机
多层感知机的基本知识深度学习主要关注多层模型。在这里,我们将以多层感知机(multilayer perceptron,MLP)为例,介绍多层神经网络的概念。隐藏层下图展示了一个多层感知机的神经网络图,它含有一个隐藏层,该层中有5个隐藏单元。表达公式 具体来说,给定一个小批量样本X∈,其批量大小为n,输入个数为d。假设多层感知机只有一个隐藏层,其中隐藏单元...原创 2020-02-11 21:30:31 · 475 阅读 · 0 评论