Deeplearning
端午过后的猪
乌龟小白在路上...慢慢爬 ...
展开
-
openpose-opencv 的coco数据多人体姿态估计
介绍opencv除了支持常用的物体检测模型和分类模型之外,还支持openpose模型,同样是线下训练和线上调用。这里不做特别多的介绍,先把源代码和数据放出来~实验模型获取地址:https://github.com/CMU-Perceptual-Computing-Lab/openpose基于coco数据的代码实现import cv2import timeimport numpy as npfrom random import randintimage1 = cv2.imread(转载 2020-07-21 17:16:28 · 1853 阅读 · 0 评论 -
深度学习之——防止过拟合的方法
1、过拟合定义:在training data上的error渐渐减小,但是在验证集上的error却反而渐渐增大——因为训练出来的网络过拟合了训练集,对训练集外的数据却不work。模型越复杂,越容易过拟合。因此,原先以最小化损失(经验风险最小化)为目标:现在以最小化损失和模型复杂度(结构风险最小化)为目标:通过降低复杂模型的复杂度来防止过拟合的规则称为正则化。2、...转载 2019-07-31 17:56:00 · 3376 阅读 · 0 评论 -
深度学习框架Darknet,其YOLO神经网络算法对目标检测效果显著
yolov3介绍比较好的文章网址:https://blog.csdn.net/leviopku/article/details/82660381https://www.jianshu.com/p/d13ae1055302本文转载地址:https://cloud.tencent.com/developer/news/76803Darknet——一个源码为C的神经网络框架...转载 2019-03-08 16:40:00 · 2299 阅读 · 0 评论 -
深度学习基础——激活函数以及什么时候该使用激活函数
转载地址:http://www.datalearner.com/blog/1051508750742453一、简介如今的互联网提供了大量的信息。我们只需要通过Google就可以找到这些信息。而我其中最重要的一个挑战是区分相关信息和非相关信息。当我们的大脑充满了信息的时候,它会第一时间区分哪些是有用信息哪些是无用信息。因此,在神经网络中我们也需要一个类似的机制来区分有用信息和无用信息。这是...转载 2018-08-06 10:01:26 · 3653 阅读 · 0 评论 -
softmax解释
sigmoid函数只能分两类,而softmax能分多类,softmax是sigmoid的扩展以下是Softmax函数的定义:这个函数与hard max(即大家通常用的max函数)有相似之处,在其中某个x显著大于其他x时,返回值接近这个x,即max下图为softmax(x, 0)和hardmax(x,0)的图形:差别就在于softmax是连续可导的,消除了拐点,这个特性在机器学习的梯度下降法等地方非...转载 2018-05-24 16:55:58 · 1861 阅读 · 1 评论 -
lstm理解
精辟文章连接:https://www.jianshu.com/p/9dc9f41f0b29https://yq.aliyun.com/articles/202939下图是mxnet中一个lstm单元门的实现函数:输入:当前输入x_t + 上层的输出h_t-1每个输入都经过4个全连接层,这里4个放在一起计算了(为了高效的实现)num_hidden: 就是自定义的全联接层的节点个数下图是2层 ...原创 2018-05-25 16:44:52 · 262 阅读 · 0 评论 -
词向量 Word Embedding one hot
转载地址:点击打开链接词向量,英文名叫Word Embedding,按照字面意思,应该是词嵌入。说到词向量,不少读者应该会立马想到Google出品的Word2Vec,大牌效应就是不一样。另外,用Keras之类的框架还有一个Embedding层,也说是将词ID映射为向量。由于先入为主的意识,大家可能就会将词向量跟Word2Vec等同起来,而反过来问“Embedding是哪种词向量?”这类问题,尤其是...转载 2018-04-13 14:56:48 · 1925 阅读 · 0 评论 -
自然语言处理(NLP)
自然语言处理:1、什么是自然语言处理(NLP)自然语言处理是一门交叉学科,包括计算机科学,人工智能和语言学目标:让计算机去处理或“理解”自然语言, 完成一些有用的任务例如问答系统,机器翻译完全理解或者表示语言的意义(甚至去定义它)都是一个虚幻的目标完美的理解语言是一个“AI-complete”的问题2、自然语言处理的应用应用范围从简单到复杂拼写检查, 关键词提取&搜索,同义词查找&...原创 2018-03-16 14:17:06 · 757 阅读 · 0 评论 -
过度拟合------正则化
转载:1. The Problem of Overfitting1还是来看预测房价的这个例子,我们先对该数据做线性回归,也就是左边第一张图。如果这么做,我们可以获得拟合数据的这样一条直线,但是,实际上这并不是一个很好的模型。我们看看这些数据,很明显,随着房子面积增大,住房价格的变化趋于稳定或者说越往右越平缓。因此线性回归并没有很好拟合训练数据。我们把此类情况称为欠拟合(underfitting),转载 2018-01-19 11:32:14 · 593 阅读 · 0 评论 -
tensorflow LSTM+CTC实现端到端的不定长数字串识别
转载地址:https://www.jianshu.com/p/45828b18f133上一篇文章tensorflow 实现端到端的OCR:二代身份证号识别实现了定长18位数字串的识别,并最终达到了98%的准确率。但是实际应用场景中,常常需要面对无法确定字串长度的情况,这时候除了需要对识别字符模型参数进行训练外,还需要对字符划分模型进行训练,本文实现了上文提到的方法2,使用L转载 2018-01-24 16:57:10 · 5282 阅读 · 3 评论 -
Deeplearning 两层cnn卷积网络详解
转载地址:https://www.cnblogs.com/sunshineatnoon/p/4584427.html在实现两层的CNN之前,首先实现了UFLDL中与CNN有关的作业。然后参考它的代码搭建了一个一层的CNN。最后实现了一个两层的CNN,码代码花了一天,调试花了5天,我也是醉了。这里记录一下通过代码对CNN加深的理解。首先,dataset是MNIST。这转载 2018-01-16 14:27:05 · 4826 阅读 · 0 评论 -
lstm+ctc 实现ocr识别
转载地址:https://zhuanlan.zhihu.com/p/21344595OCR是一个古老的研究领域,简单说就是把图片上的文字转化为文本的过程。在最近几年随着大数据的发展,广大爬虫工程师在对抗验证码时也得用上OCR。所以,这篇文章主要说的OCR其实就是图片验证码的识别。OCR并不是我的研究方向,我研究这个问题是因为OCR是一个可以同时用CNN,RNN两种算法都可以很好解决转载 2018-01-23 15:37:49 · 9215 阅读 · 2 评论 -
Deeplearning 学习资料推介
deeplearning:CS231n课程总结tensorflow: 官方文档: tensorflow中文社区 好文推荐: tensorflow入门 tensorflow笔记 tensorflow数据读取机制原创 2017-09-12 17:24:15 · 374 阅读 · 0 评论 -
深度学习最全优化方法总结比较(SGD,Adagrad,Adadelta,Adam,Adamax,Nadam)
https://zhuanlan.zhihu.com/p/22252270转载 2017-11-09 11:09:01 · 458 阅读 · 0 评论