machine learning
文章平均质量分 74
Bazingaea
生命不息 学习不止
展开
-
Octave入门(一)
Octave安装直接搜就有,贴一个可在线运行的网址:Octave在线 Octave是一门针对数值运算的编程语言,和matlab很相近,对matlab有些了解的话会觉得octave也很熟悉按照默认安装完Octave以后(尽量安装4.0以后的版本),会在桌面上出现两个快捷方式,其中一个是可视化界面,另一个是命令行操作界面,不过可能因为选择的安装包不同,没有安装可视化界面,下面所有Octav...原创 2018-07-21 18:39:02 · 3113 阅读 · 0 评论 -
Word2Vec之数学原理推导
对word2vec不了解的可以先看看这篇Word2vec入门网上很多word2vec的前向传播和反向传播给出的推导都不是很好理解,而且对于不太同种的实现方式也没有具体说明,所以一直想把这部分的坑填上,参考了网上的一篇优秀博客天空的城:Word2vec数学原理全家桶,对其做了进一步解释和修正。ONE-WORD-MODEL在说word2vec模型之前,先谈一谈ONE-WORD-MODEL,这个模...原创 2019-04-22 16:15:36 · 597 阅读 · 1 评论 -
句子相似度常见的计算方法
原文地址:静觅»自然语言处理中句子相似度计算的几种方法在做自然语言处理的过程中,我们经常会遇到需要找出相似语句的场景,或者找出句子的近似表达,这时候我们就需要把类似的句子归到一起,这里面就涉及到句子相似度计算的问题,那么本节就来了解一下怎么样来用 Python 实现句子相似度的计算。基本方法句子相似度计算我们一共归类了以下几种方法:编辑距离计算 杰卡德系数计算 TF 计算...转载 2019-04-22 13:21:00 · 3138 阅读 · 1 评论 -
【译】Parsing C++ in Python with Clang
本文不是全部翻译,仅仅针对重要内容,添加了一些的实战经验,方便日后查阅Clang开发团队意识到,Clang不仅仅可以被用来作为编译器,还可以作为分析C/C++/Objc代码的工具。事实上苹果自带的Xcode代码编译底层用的就是Clang。libclang是clang一个强大的开发接口,本质上是一个C API,可以进行词法和语法分析,比如它可以让用户以AST结构去检验分析一段代码。python...翻译 2019-04-09 18:14:48 · 2021 阅读 · 0 评论 -
ubuntu16.04搭建cuda9.0+cudnn7.0.5环境
在安装cuda之前,最重要的就是检查你的显卡是不是支持cuda安装版本。官网给出说明是只要在cuda支持显卡列表里的显卡就可以,但是我的显卡NVS 310虽然在,安装cuda以后会报错,因为显卡不支持。所以我猜测这个显卡或许可以支持低版本的cuda。官网的安装文档:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/显卡列表:h...原创 2019-01-15 17:44:05 · 2067 阅读 · 0 评论 -
Word2Vec入门
本文是对原文地址的翻译word2vec是一个用来处理文本的二层神经网络,它的输入是一个文本集,输出是一系列集合,这个集合是与文本集是对应的。明显word2vec不是一个深度学习网络,它只是将文本转化为深度网络可以理解的数值化格式。deeplwarning4j实现了一个分布式的Word2vec for Java和Scala,它可以在Spark上运行GPU。word2vec做的不仅仅是解析文集中...翻译 2018-12-15 20:52:55 · 674 阅读 · 0 评论 -
TensorFlow(八)TFRecords使用方法与实例
这篇文章介绍如何将大量数据存储为TFRecords格式的文件,然后将TFRecords格式的文件按批次处理的方式引入代码中,用来训练你的模型。本文借鉴了 link中的大部分内容,加上自己的理解和对代码中用到的库的补充说明。TFRecords 是 Tensorflow standard format ,就是tf标准的数据形式,tf源码中他提供了很多net结构,也就是网络结构,这些网络结构都是...翻译 2018-12-14 21:17:47 · 1418 阅读 · 0 评论 -
Multi-Task Learning & Multiclass classification
最开始接触的机器学习问题就是 “ Is this a cat or not ” ,这是极具有代表性的一个二分类问题(Binary or binomial classification),二分类体现在数据的标签上就是0/1,一张图片作为输入X,对于监督学习而言,他的标签Y就是一个数字0/1,后面讲到的例子若不特殊说明都是监督学习。多分类问题(Multiclass classification)就是...原创 2018-12-12 18:40:26 · 786 阅读 · 0 评论 -
关于BP算法和梯度下降
最开始学习神经网络,感触最深的就是BP算法,当时只用到却没有好好体会它背后的深意,在RNN中也会用到一个类似的算法(BPTT下面会具体讲)。对神经网络有些了解,就会熟悉BP算法由两个部分组成,向前传播和反向传播。向前传播从输入层经过隐藏层到输出层,给出预测结果,在第一次传输过程中,使用到的权重(或者说参数)都是最开始随机初始化的,可想而知这样随机初始化的权重,最后得到的结果,与真实值的误差一定...原创 2018-11-17 14:15:28 · 4565 阅读 · 0 评论 -
优化算法(一)SGD算法实现
SGD随机梯度下降算法,和最常用的GD相比,GD每一次迭代都是所有样本都一起进行计算,而SGD是每一次迭代中每个样本分别进行计算,梯度算法的最终目标是减少cost值,训练出最优的参数值,GD每一次迭代都让所有样本去优化参数,一次迭代进行一次优化,而SGD一次只让一个样本去优化参数。 贴一下代码:#SGD(w初始化使用 2/sqrt(l-1))def SGD_model(X,Y,la...原创 2018-11-03 21:31:52 · 7261 阅读 · 0 评论 -
深度学习-吴恩达第一课第四周课程作业
在前面两节课的基础上,这次作业是训练一个N层神经网络,来判断一张图片是否有猫,实现过程其实和第三周很相似,因为层数不确定,所以在向前传播和反向传播的时候会用到for循环,代码相对而言反而更精简了。贴出的代码可能和老师给的模板不一样,我没有看到老师的原版课程作业,也是在网上找的资料自己写的,但是网上的代码大部分函数封装度高,但初学为了方便,也好理解,我没有采用那种方法。简单介绍一下模型,N层,传...原创 2018-10-21 21:04:52 · 1484 阅读 · 0 评论 -
神经网络优化-正则化&DropOut
实现正则化主要需要在两个地方做出修改:1.cost计算(L2 regularization) #正则化 n = len(parameters)//2 cost_extra = 0 for x in range(n): w = parameters['w'+str(x+1)] cost_extra += np.sum(np...原创 2018-10-28 18:22:59 · 684 阅读 · 0 评论 -
深度学习-吴恩达第一课第三周课程作业
第二周的课程作业是利用逻辑回归来训练一个分类器来辨别一张图片是否为猫,这周老师讲了单隐层的神经网络,所以先看看利用这个模型能否在上次作业的基础上对训练准确度作出改善训练一个神经网络神经网络分为几层,隐藏层中包含几个神经元,使用的激活函数 初始化参数 W(i)和 B(i) 搞清楚参数的维度 准备数据 X ,Y 同样的要搞清楚维度 向前传播,计算代价函数,反向传播,更新参数...原创 2018-10-20 17:08:38 · 1311 阅读 · 3 评论 -
深度学习-吴恩达第一课第二周课程作业
这周作业是,给出一张图片,判断这张图是不是猫。这是一个二分类问题,结果是非0即1的,使用逻辑回归(Logic Regression),可以说,了解这个回归方法,有些python基础,会使用jupyter notebook就可以尝试着码一遍代码,走完整个学习流程,能进一步加深对逻辑回归的了解,对下一步的学习也有好处。首先在写代码之前,需要把逻辑回归向量化理解清楚,因为后面代码不是用循环来写的,是...原创 2018-10-13 20:55:45 · 1246 阅读 · 0 评论 -
Sklearn.metrics评估方法介绍
在介绍指标之前,先回顾一下很重要的四个概念,可以说指标总是围绕着这四个来计算的。真实 1真实 0预测 1true positivefalse positive预测 0false negativetrue negative记忆小技巧:true/false 后面的pos or neg与预测值有关,预测为1就是positive,为0就是negative,然后如...原创 2019-05-10 11:17:09 · 5668 阅读 · 0 评论