gentelyang-CSDN博客

原创 SSD: Single Shot MultiBox Detector学习总结

发表会议：2016 ECCV作者：Wei Liu论文：https://arxiv.org/abs/1512.02325代码：https://github.com/weiliu89/caffe/tree/ssd一：模型结构SSD由VGG-16扩展并添加四个卷积层而成。 ...

2018-11-21 17:41:39 483

原创 YOLO3学习总结

一：背景介绍：YOLO-v3与目前最好的实时监测网络的性能对比OLO作者推出 YOLOv3版，在Titan X上训练时，在mAP相当的情况下，v3的速度比 RetinaNet快3.8倍，同时YOLOv3 可以在22ms之内执行完一张320×320的图片，mAP得分是 51.5，和SSD的准确率相当，但是比它快三倍。YOLOv3非常快速和准确，在IoU=0.5的情况下，与Focal Loss的mAP...

2018-07-01 14:32:36 21026 1

原创 YOLO学习总结

每个网格要预测B个bounding box，每个bounding box除了要回归自身的位置之外，还要附带预测一个confidence值。 confidence代表了所预测的box中含有object的置信度和这个box预测的有多准两重信息。YOLO的一些细节：1：每个grid有30维，这30维中，8维是回归box的坐标，2维是box的confidence，还有20维是类别。...

2018-05-28 21:09:14 1816 1

原创 R-C3D: Region Convolutional 3D Network for Temporal Activity Detection

1：时序检测（Tmporal Action Detection）时序动作检测这一方向，Video Analysis相关领域解读之Temporal Action Detection（时序行为检测）是要在视频序列中确定动作发生的时间区间及动作的类别，类似于图像中的目标检测任务，时序检测也可以分为生成时间区间提名及对提名进行分类两个环节。该任务是在视频序列中确定动作发生的时间区间及动作的类别，最常用的...

2018-05-28 19:09:02 2406 1

原创 RCNN,Fast RCNN, Faster RCNN整理总结

行人检测概述：行人检测有两种方向，传统算法和基于深度学习算法。传统算法的典型代表有Haar特征+Adaboost算法，Hog特征+Svm算法，DPM算法。而基于深度学习的行人检测典型代表有RCNN系列，YOLO系列和SSD系列。其中RCNN系列算法是现在使用的最广泛的基于深度学习的行人检测算法。在说行人检测之前不得不说一下目标检测。行人检测是目标检测下的一个...

2018-05-27 17:02:07 85651 10

原创数据库引擎学习总结

一：数据库引擎的定义数据库引擎简单来说就是一个"数据库发动机"。当你访问数据库时，不管是手工访问，还是程序访问，都不是直接读写数据库文件，而是通过数据库引擎去访问数据库文件。以关系型数据库为例，你发SQL语句给数据库引擎，数据库引擎解释SQL语句，提取出你需要的数据返回给你。因此，对访问者来说，数据库引擎就是SQL语句的解释器。正式来说，数据库引擎是用于存储、处理和保护数据的核心服务。利用数据...

2018-05-19 11:07:03 14144

原创 xgboost原理与代码实现实例

在学习xgboost之前必须要熟悉gbdt，gbdt就是boosting方法和cart回归树，通过拟合上一个模型的残差进行学习。此题直接从需要优化的目标函数说起，这个目标函数总体包括三部分，第一部分就是损失函数l，第二部分f（t）部分就是指的L1、L2正则，constant指的是常数项，xgboost是泰勒展开的三项做了一个近似，最终的目标函数只依赖于一阶和二阶导数。...

2018-04-26 22:24:17 17874 1

原创人脸识别中面对的难题

1：光照问题：在非理想环境光照条件下和用户不配合（视角变化、表情变化、饰物乃至化妆）时，大多数人脸识别系统必然遇到识别性能下降问题。在诸多影响人脸识别性能的因素中，环境光照的变化是人脸识别领域最具挑战性的难题。由于环境光照变化的影响，使得现有大部分人脸识别产品在实际应用中受到极大的局限。当识别时的环境光照和注册时的环境光照不同时，往往会引起人脸识别的性能大大下降。这也是制约现有人脸识别系统真正可...

2018-04-19 16:42:41 7372

原创利用BiLSTM网络实现文本分类

这里数据的Preprocess过程不贴代码了，训练过程（train）也不贴了，只是记录一下BiLSTM网络实现代码：这里隐层数为2，词向量为100维。import tensorflow as tffrom tensorflow.contrib import rnnclass Model(object): def __init__(self, num_layers

2018-01-29 15:54:02 8671 2

原创长短时记忆网络（LSTM）

在文本分类中，CNN由于主要提取的是局部特征而忽略了global特征，这容易造成一次多义的现象，进而对文本分类的精度产生一定的影响，而LSTM是RNN的一种变形，其处理的输入是序列化的输入，RNN由于容易更长久的记忆能力，容易造成梯度消失，所以可以利用lstm模型来防止序列化输入在传输时造成的梯度消失现象。利用BPTT算法来优化参数。由于RNN能学习任意时间长度序列的输入，但随着输入的增...

2018-01-29 15:46:14 6605

原创利用卷积神经网络（cnn）实现文本分类

卷积神经网络在情感分析中取得了很好的成果，相比于之前浅层的机器学习方法如NB、SVM效果更好，特别实在数据集较大的情况下，并且CNN不用我们手动去提取特征，原浅层ML是需要进行文本特征提取、文本特征表示、归一化、最后进行文本分类，文本特征提取主要可以分为四步：（1）：对全部训练文档进行分词，由这些词作为向量的维数来表示文本;（2）：统计每一类文档中所有出现的词语及其频率，然后过滤，剔除停用词和单字...

2018-01-09 11:41:20 28063 9

原创 NLP之文本分类方法之基础知识

一：文本分类的处理大致分为文本预处理、文本特征提取、分类模型构建等。和英文文本处理分类相比，中文文本的预处理是关键技术。1:文本预处理（解决特征空间高维性、语义相关性和特征分布稀疏）1.1中文分词技术为什么分词处理？因为研究表明特征粒度为词粒度远远好于字粒度，其大部分分类算法不考虑词序信息，基于字粒度的损失了过多的n-gram信息。中文分词主要分为两类方法：基于词典的中文分词和

2018-01-05 15:39:17 4893

原创 word2vec的学习心得及glove介绍

词向量的表示方法有很多中，比如用语料库、one-hot、词典、bag of words、TF-IDF、n-gram等等，这些都可以将一个词表示成词向量，但是它们有一个问题就是它们只是单纯的把词用向量表示出来，但没有利用到词和词之间的关系，比如猫用[0,0,1,...,0]狗用[0,1,....0]表示，没有注意到猫和狗之间的关系它们都是动物，所以我现在看一下能从其他周围的向量根据关系来预测向量的模...

2017-09-13 17:30:57 912

原创迁移学习和finetune的区别及迁移学习代码实现

1：迁移学习是将已经学习到的知识应用到其他领域，比如通用的语音模型迁移到某个人的语音模型上。迁移学习就是将一个问题上训练好的模型通过简单的调整使其适用于一个新的问题。例如利用ImageNet数据集上训练好的Inception-V3模型来解决一个新的图像分类问题，可以保留训练好的Inception-v3模型中所有卷积层的参数，只是替换最后一层全连接层，在最后这一层全连接层之前的网络...

2017-08-23 22:14:16 18448 3

原创深度自编码器python实现

深度自编码器的原理上一节已经讲过，这次我们来看一下它的python代码实现，这是基于mnist的自编码实现。from __future__ import division, print_function, absolute_importimport tensorflow as tfimport numpy as npimport matplotlib.pyplot as plt

2017-08-22 15:28:29 8393

原创自然语言处理小知识点

构建平行语料库的流程方法语料的采集：在进行语料采集时，需要考虑两点因素：一是原始语料本身的质量，二是语料库的应用目标。语料的质量主要是语言质量、翻译质量及语料保存的规范性而言。如何建立语料库建立单语语料库比较简单，只需要准备好相关语料（古代汉语/现代汉语/英文/其它语言），将语料导入到AntConc软件进行检索即可。建立双语语料库，需要准备双语对照（中英对照）的原文和译文，...

2019-03-09 19:05:30 754

原创语料库汇总

1 语言资源2 搜狗实验室（Sogou Labs）3 Acollection of Chinese corpora and frequency lists4 Corpus-basedLanguage StudyTheLancaster Los Angeles Spoken Chinese Corpus5 http://lingcorpus.iis.sinica.edu.tw/c...

2019-03-09 10:12:36 4293

原创 python基础(2)

1：dir（）函数dir（）函数不带参数时，返回当前范围内的变量、方法和定义的类型列表;带参数时，返回参数的属性、方法列表。如果参数方法__dir__()，该方法将被调用，如果参数不包括__dir__()，该该方法将最大限度的收集信息。2：python链接mysql数据库由于MySQL服务器以独立的进程运行，并通过网络对外服务，所以需要支持python的MySQL驱动来连接到MySQL...

2019-01-25 16:23:38 500

原创 python基础(1)

1:列表复制# -*- coding=utflist1=[1,2,3]list2=[1,2,3，4]a=list1[:]b=list2print(b)print(a)输出：[1, 2, 3, 4][1, 2, 3]比较推荐的列表复制方法是list1[:]这种方法，b=list2方法很容易出现各种问题。2:垃圾回收机制java和C#都采用了垃圾手机机制，而不再是...

2019-01-22 23:10:48 731

原创 Go基础编程：获取命令行参数

部署golang项目时难免要通过命令行来设置一些参数，那么在golang中如何操作命令行参数呢？可以使用flag库和os库。1：flag库的使用Go语言标准库提供了用于快迅解析命令行参数的flag包,大致的使用步骤如下: a.通过flag.String(), flag.Bool(), flag.Int()等方式来定义命令行中需要使用的参数。 b.在定义完flag后，通过调用flag.Par...

2019-01-16 23:32:19 220

原创 Go语言之defer应用

defer作用关键字defer用于延迟一个函数或者方法的执行，注意defer语句智能出现在函数或者方法的内部。defer语句经常用于处理成对的操作，如打开、关闭、连接、断开连接、加锁和释放锁。通过defer机制，不论函数逻辑多复杂，都能保证在任何执行路径下，资源被释放，释放资源的defer应该直接跟在请求资源的语句后。多个defer执行顺序如果一个函数中有多个defer语句，它...

2019-01-15 14:38:14 190

原创 Go语言递归函数

递归函数可以直接或者间接的调用自身递归函数通常有相同的结构：一个跳出条件和一个递归体。跳出条件是看根据传入的参数判断是否需要停止递归，而递归体则是函数本身所做的一些处理。Go语言中的函数类型，函数也属于一种数据结构，我们可以通过type来定义它，它的类型就是所有拥有相同参数，相同的返回值的一种类型。匿名函数与闭包闭包就是一个函数捕获了和它在同一作用域的其它常量和变量，...

2019-01-15 11:29:30 1328

原创 Go语言之自定义函数

函数构成代码执行的逻辑结构。在Go语言中，函数的基本组成为：关键字func、函数名、参数列表、返回值、函数体和返回语句。Go语言函数定义格式如下：返回类型：①　上面返回值声明了两个变量名o1和o2(命名返回参数)，这个不是必须，可以只有类型没有变量名 ②　如果只有一个返回值且不声明返回值变量，那么你可以省略，包括返回值的括号 ③　如果没有返回值，那么就直接省略最后的返回信息 ...

2019-01-14 15:05:18 1151

原创 Go语言条件、循环语句

Go语言支持基本的三种程序运行结构：顺序结构、选择结构、循环结构。选择结构if 初始化字句；条件表达式Switch语句Go里面switch默认相当于每个case最后带有break，匹配成功后不会自动向下执行其它case，而是跳出整个switch，但是可以使用fallthrough强行执行后面的case代码：可以使用任何类型或表达式作为条件语句：循环语句...

2019-01-14 14:41:29 503

原创 Go语言运算符

1.算术运算符在Go语言中，++与-是作为语句而不是作为表达式。关系运算符逻辑运算符位运算符赋值运算符其它运算符运算符优先级在Go语言中，一元运算符拥有最高的优先级，二元运算符的运算方向均是从左至右下表列出了所有运算符以及它们的优先级，由上至下优先级由高到低： ...

2019-01-14 13:41:03 532

原创 Go语言基础编程：格式化输出、类型转换和类型别名

fmt.Printf()格式字符串数据类型转换Go语言不允许隐式转换，所有类型转换必须显示声明，而且转换智能发生在两种相互兼容的类型之间类型别名...

2019-01-14 11:30:30 170

原创 Go语言的基础数据类型

1.布尔类型2.整型3.浮点型4.字符类型Go语言支持两种字符类型，一个是byte，代表utf-8字符串中单个字节的值，另一个是rune，代表单个unicode字符5.字符串6.复数类型 ...

2019-01-14 11:23:12 140

原创 Go语言的关键字、变量、常量

1.关键字Go语言有25个关键字。30多个预定义的名字，比如int和true等。2.变量从根本上说，变量相当于是对一块数据存储空间的命名，程序可以通过定义一个变量来申请一块数据存储空间，之后可以通过引用变量名来使用这块存储空间。3.变量声明4.变量初始化5.变量赋值6.匿名变量_（下划线）是个特殊的变量名，任何赋予它的值都会被丢弃：7...

2019-01-14 11:00:11 334

原创 go语言介绍

Go语言（或称Golang）是云计算时代的C语言。Go语言的诞生是为了让程序员有更高的生产效率，Go语言专门针对多处理器系统应用程序的编程进行了优化，使用Go编译的程序可以媲美C或C++代码的速度，而且更加安全、支持并行进程。Go语言优势：可直接编译成机器码，不依赖其他库，glibc的版本有一定要求，部署就是扔一个文件上去就完成了。静态类型语言，但是有动态语言的感觉，静态类型的语言就是...

2019-01-14 10:30:44 162

原创 redis之用作消息队列

背景需要开发app抢购的api，需要处理大量的请求，需要有高响应率，例如淘宝和京东的秒杀，会在一个时间点有大量的请求。设计思路首先用nginx做负载均衡，根据ip_hash分配请求到不同服务器上，默认前三台服务器能处理请求，其余自动抛弃请求。每台服务器上都设置有消息队列。api的作用就是接收请求，请求放到消息队列里，返回给客户端一个等待处理结果的消息。然后服务器后台一直跑一...

2018-08-20 21:43:07 291

转载激活函数之maxout

https://blog.csdn.net/hjimce/article/details/50414467这篇博客讲的很好，以后再整理。

2018-08-11 11:00:33 7225

原创 keras学习笔记

keras中文文档中写的很详细，学习的最佳笔记没有之一。https://keras-cn-docs.readthedocs.io/zh_CN/latest/

2018-08-03 11:39:21 217

原创 tensorflow之tensorflow.contrib.slim中的slim的用法

slim的作用主要是用来简化代码，使代码更加简洁规整。https://blog.csdn.net/mao_xiao_feng/article/details/73409975看这个博客，如何搭建模型，如何训练，如何保存模型非常详细不错的博客。 ...

2018-08-03 09:18:16 6192

原创传统的协同过滤

一：几种不同的推荐算法概述1. 传统的协同过滤推荐通过用户的最近邻居产生最终的推荐,基于项目的协同过滤推荐首先计算项目之间的相关性的相关性,然后通过用户对相关项目的评分预测用户对未评分项目的评分。2. Bayesian 网络技术利用训练集创建相应的模型[7],模型用决策树表示,节点和边表示用户信息.训练得到的模型非常小,所以对模型的应用非常快.这种方法适合于用户的兴趣爱好变化比较慢的场合 3. 聚...

2018-07-01 15:02:59 1375

原创 Effective Approaches to Attention-based Neural Machine Translation之每日一篇

论文地址：http://www.cs.cmu.edu/~ark/EMNLP-2015/proceedings/EMNLP/pdf/EMNLP166.pdf概述：本文针对NMT任务是用attention机制提出两种结构，global attention将attention作用于全部输入序列，local attention每个时间步将attention作用于输入序列的不同子集。前者被称为soft at...

2018-06-29 16:06:51 426

原创 Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation之每日一篇

真正提出 Seq2Seq 的文章是《Sequence to Sequence Learning with Neural Networks》，但本篇《Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation》比前者更早使用了 Seq2Seq 模型来解决机器翻译的问题。摘要...

2018-06-29 09:40:02 6819

原创短文本分类的 ResLCNN 模型

收稿时间: 2017-06-30; 采用时间: 2017-10-20Journal of Software在 He 等人研究中,34 层的 CNN 比 18 层的 CNN 效果差.同样,在 Donahue 等人研究中也提到,双层的 LSTM 模型效果是最好的,多层的 LSTM 效果出现退化现象.为解决此退化问题,He 等人[8]提出了残差网络.受此启发,为了提高模型性能。ResLCNN模型以wor...

2018-06-28 11:34:16 3446 1

原创 Very Deep Convolutional Networks for Text Classification之每日一篇

一：介绍这篇文章是2017.1月发表，在这篇文章出现之前，卷积神经网络进行文本分类都是用的很浅层的CNN，基本是一个词嵌入层、一个卷积一个池化然后两个全连接层，文章利用了29个卷积层，提升文本分类的准去率。这篇文章是首创式的用将深度较深的CNN应用在NLP中。二：VDCNN结构模型介绍：此模型由8个卷积层block，3个最大池化层，一个k-max pooling 和3个全连接层组成。卷积层的通道数...

2018-06-28 10:28:02 2603

原创 Character-level Convolutional Networks for Text Classification之每日一篇

这篇文章发表于2016.04，作者还发表了一篇Text Unders tanding from Scratch的论文，有兴趣的可以去看看。1：Character quantization构建字母表，包含70种字符。The alphabet used in all of our models consists of 70 characters, including 26 english letter...

2018-06-27 19:58:41 2528 1

原创 A Sensitivity Analysis of Convolutional Neural Networks for Sentence Classification之每日一篇

论文Convolutional neural networks for sentence classification，这篇文章已经介绍过了，它介绍了如何使用CNN做句子分类（文本分类）；而本文主要介绍了用CNN做句子分类的时的一些经验，如何调节超参。超参数包括：词向量，Region size大小，feature map的数量，激活函，pooling，正则化的影响。模型图：词向量：词向量的表示形式...

2018-06-27 15:29:18 350

空空如也

空空如也