![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
theoreoeater
这个作者很懒,什么都没留下…
展开
-
【深度学习——点云】PointNet
这篇文章是发表在CVPR 2017上的一篇关于对点云数据进行分类与分割的文章,文章链接:PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation1. Background大数据时代下3D数据的日益增多,急需一套有效的针对3D数据的深度学习网络来进行分类、分割等任务。点云是一种简洁的、最接近原始传...原创 2019-05-10 17:10:54 · 1200 阅读 · 0 评论 -
【深度学习——点云】DGCNN(EdgeConv)
这篇文章提出一种边卷积(EdgeConv)操作,来完成点云中点与点之间关系的建模,使得网络能够更好地学习局部和全局特征。论文地址:Dynamic Graph CNN For Learning On Point Clouds1. MotivationPointNet网络对点特征的单独提取使得网络缺乏对局部特征的学习,PointNet++在PointNet基础上对点云进行区域采样使用Point...原创 2019-05-14 21:47:44 · 9800 阅读 · 3 评论 -
【深度学习——点云】PointNet++
这篇文章发表于NIPS 2017,是在PointNet基础上的工作,论文地址:PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space。1. MotivationPointNet处理点云的方式是首先单独对每一个点进行特征映射再使用MaxPooling在所有点特征上提取整体特征,这一过程中缺少...原创 2019-05-14 09:02:30 · 1479 阅读 · 0 评论 -
深度学习半自动化视频标注工具——VATIC使用教程
Vatic简介 Vatic是一个带有目标跟踪的半自动化视频标注工具,适合目标检测任务的标注工作。输入一段视频,支持自动抽取成粒度合适的标注任务并在流程上支持接入亚马逊的众包平台Mechanical Turk,当然也可以自己在本地标注。最大的特点是它内含基于opencv的tracking,这样一段视频只需抽样标注就好了,大大减少了工作量。下图是官网一个标注篮球比赛球员的示例。Vatic使...原创 2019-01-23 10:04:27 · 10191 阅读 · 12 评论 -
【Pytorch】CIFAR-10分类任务
CIFAR-10数据集共有60000张32*32彩色图片,分为10类,每类有6000张图片。其中50000张用于训练,构成5个训练batch,每一批次10000张图片,其余10000张图片用于测试。CIFAR-10数据集下载地址:点击下载数据读取,这里选择下载python版本的数据集,解压后得到如下文件:其中data_batch_1~data_batch_5为训练集的5个批次,...原创 2018-07-16 16:23:36 · 5800 阅读 · 6 评论 -
【论文笔记】Effective Approaches to Attention-based Neural Machine Translation
论文链接 本文针对NMT任务使用的attention机制提出两种结构,global attention将attention作用于全部输入序列,local attention每个时间步将attention作用于输入序列的不同子集。前者被称为soft attention,其原理和论文1一样,后者是hard attention和soft attention的结合,该文通过context vector...原创 2018-05-31 13:49:53 · 2676 阅读 · 1 评论 -
【Tensorflow】Bi-LSTM文本分类
用于训练的计算图#训练图train_graph = tf.Graph()with train_graph.as_default(): #输入文本维度为[time_step,batch_size,embedding_size] encoder_inputs = tf.placeholder(shape=[None,None,input_size], dtype=tf.float3...原创 2018-06-07 10:50:01 · 4817 阅读 · 0 评论 -
【论文笔记】SPPnet
论文链接 CNN模型在识别图片前需要将图片预处理(如裁剪,扭曲)成同样大小尺寸,流程如下图所示。这一步骤不仅繁琐而且由于尺寸变化可能会影响识别精度。 事实上卷积层、池化层、激活层可以适应任意尺寸图片,但用于分类的全连接层需要固定尺寸的输入。为了解决这一问题,SPPnet在特征提取层和全连接层中间添加了金字塔池化层 (SPP layer),使得任意尺寸的图片...原创 2018-05-31 10:55:57 · 404 阅读 · 0 评论 -
【论文笔记】neural machine translation by jointly learning to align and translate
1.neural machine translation by jointly learning to align and translate 这篇文章是将attention机制应用于机器翻译上,普通的seq2seq模型要将输入文本的信息编码至固定长度的隐向量中,当面对长文本时会损失许多信息,那么就要利用attention对输入文本的不同片段根据其重要程度分配不同的权重,使得信息被更有效地编码...原创 2018-05-30 14:31:24 · 1542 阅读 · 1 评论 -
【Tensorflow】文本自编码器
使用文本序列的word2vec词向量作为seq2seq模型的输入和输出,训练得到中间层的文本特征表示,可进一步进行分类任务等,encoder和decoder都使用LSTM。import tensorflow as tfimport numpy as npimport refrom gensim.models import Word2Vecimport pandas as pdimport...原创 2018-05-30 09:57:18 · 2735 阅读 · 5 评论 -
【论文笔记】GloVe: Global Vectors forWord Representation
摘要 词向量的成功捕捉到了细粒度的语义信息和语法规则,本文提出的方法融合了主流模型的优点:全局矩阵分解(LSA)和局部内容窗口(Word2vec),充分利用统计信息使用词共现矩阵中频率非零的元素来训练模型。引言 使用向量空间来表示自然语言可以做为许多NLP任务(文本分类,信息检索......)的特征输入,主流的两种方法是基于全局矩阵分解的LSA和局部窗口信息的Word2vec。LSA虽...原创 2018-05-22 21:06:38 · 4215 阅读 · 1 评论 -
【深度学习——点云】PointConv
这是发表于CVPR2019的关于点云分类与分割的论文,论文地址:PointConv: Deep Convolutional Networks on 3D Point Clouds1. Motivation在2D图像任务中,拥有平移不变性、局部连接、参数共享等优点CNNs取得了良好的效果,CNNs逐层学习并整合局部特征的特点使得其学习到的特征鲁棒性很强,但是要把卷积操作...原创 2019-05-16 20:48:17 · 1170 阅读 · 0 评论