深度学习
文章平均质量分 94
琴&
这个作者很懒,什么都没留下…
展开
-
认识深度学习
深度学习Python的使用利用向量化替代for循环利用numpy工具包对矩阵向量运算替代重复计算广播机制常用reshape方法确保变量的维度axis 选择方向:1代表水平方向 0代表竖直方向广播机制中常见bug:np.random.randn(5) 与 np.random.randn(5,1) 的区别前者为一维数组,后者为行向量解决未知变量是否为行向量:断言assert(a.shape==(5,1))数组 -> 行向量: a = a.reshape((5原创 2021-03-29 07:54:02 · 1993 阅读 · 0 评论 -
机器学习应用策略
正交化正则化的超参数,这些参数尽量正交,互不影响早停并没有那么好用单实数评估标准提出一个实数评估标准比如查全率和查准率,这里使用F1作为两个参数的均衡F1=21p+1RF1 = \frac{2}{\frac{1}{p}+\frac{1}{R}}F1=p1+R12满足和优化指标必须满足某个条件下如准确率到达一定阈值以后,再去优化另一个指标。训练-验证-测试集测试这些集合应该反映未来可能遇到的训练集,尽量覆盖整个分布;现代数据集过大,例如一百万数据集,这时候使用的应.原创 2021-03-29 07:54:23 · 1850 阅读 · 0 评论 -
卷积神经网络
卷积运算部分将卷积核经过水平轴和竖直方向轴旋转之后才进行运算,在深度学习中不需要(互相关)常见的过滤器(核)sobel filter [[1 0 -1], [2 0 -2], [1 0 -1]]scharr filter[[3 0 -3], [10 0 -10], [3 0 -3]]而通常的做法是将过滤器九个数字作为w参数输入网络通过BP算法学习缺点:在每次卷积运算之后,图片都会变小,特征缩小图像边界点检测丢失注:处理图像分辨率计算方法:n为原图单原创 2021-03-29 07:54:41 · 1891 阅读 · 0 评论 -
序列模型
输出的结果长度不是一定的(比如机器翻译)循环神经网络RNN每个词进行分析输出之前还输入了来自上一次分析的时间步,如图所示,右边代表是简化的模型展示。通常:计算各个层的时间步a使用tanh函数作为激活函数各层的输出结果使用sigmoid函数作为激活函数a<t>=g(Wa⋅[a<t−1>,xt]+ba)Wa=[Waa(100)∣Wax(10000)](100⋅10100)y^<t>=g(Wya<t>+by)a^{<t>} = g.原创 2021-03-29 07:55:00 · 1965 阅读 · 0 评论 -
快速入门pyTorch,实现手写数字识别
PytorchTensor各种数值称为张量,例如常数0阶、向量1阶、矩阵2阶张量创建方法import torchimport numpy as np# 原始类型torch.Tensor([1,2,3]) tensor([1., 2., 3.])# 数据转换torch.Tensor(arr) tensor([[ 0., 1., 2., 3.], [ 4., 5., 6., 7.], [ 8., 9., 1原创 2021-03-29 07:55:24 · 1878 阅读 · 0 评论 -
【pytorch】双向LSTM实现文本情感分析
整个个专栏记录一下深度学习的相关文章(一)认识深度学习(二)机器学习应用策略(三)卷积神经网络(四)序列模型(五)pytorch从零实现手写数字识别(六)认识NLP,RNN实现文本情感分析(六)经典试题整合循环神经网络tokenization:分词 token:具体的词常见工具jiebaTHULAC(不推荐)分词方法:句子转为词语句子转换为单个字N-gram准备词语特征的方法,N代表能够一起使用的词的数量分词长度:len(cuted) -1 、获取分词(以.原创 2021-03-29 08:11:46 · 3374 阅读 · 1 评论 -
深度学习经典试题29道
所有试题来自公众号【读芯术】课后测试深度学习中的“深度”是指A. 计算机理解深度B. 中间神经元网络的层次很多C. 计算机的求解更加精确D. 计算机对问题的处理更加灵活B下列哪一项在神经网络中引入了非线性A. 随机梯度下降B. 修正线性单元(ReLU)C. 卷积函数D. 以上都不对B下列哪个神经网络结构会发生权重共享A. 卷积神经网络B. 循环神经网络C. 全连接神经网络D. 选项A和BD关于句子向量表示,下列说法正确的是A. 只能通过有监督学习获得原创 2020-06-30 09:42:56 · 29783 阅读 · 0 评论