自然场景文本检测技术综述(CTPN, SegLink, EAST)

文章转载自:https://www.cnblogs.com/skyfsm/p/9776611.html 前言 文字识别分为两个具体步骤:文字的检测和文字的识别,两者缺一不可,尤其是文字检测,是识别的前提条件,若文字都找不到,那何谈文字识别。今天我们首先来谈一下当今流行的文字检测技术有哪些。 文本检...

2019-03-25 13:38:40

阅读数 284

评论数 0

【论文笔记】CNN图像分类Tricks合集

paper:Bag of Tricks for Image Classification with Convolutional Neural Networks author: Tong He, Zhi Zhang, Hang Zhang, Zhongyue Zhang, Junyuan Xie, ...

2019-01-09 19:39:08

阅读数 516

评论数 0

【论文笔记】视频分类与图网络的结合 Videos as Space-Time Region Graphs

Paper: https://arxiv.org/abs/1806.01810 (ECCV 2018) Author: Xiaolong Wang, Abhinav Gupta (CMU) 0. 引言 GNN最近在深度学习领域受到了广泛关注,其具有解决深度学习无法解决的因果推理和可解释性的问题,可...

2018-12-26 20:40:04

阅读数 459

评论数 0

【论文笔记】时空域特征学习的反思:视频分类中速度与精度的权衡

论文链接: rethinking spatiotemporal feature learning: speed-accuracy trade-offs in video classification Google Research & U...

2018-10-12 20:06:31

阅读数 779

评论数 0

【论文笔记】光流在视频行为识别中的作用

Paper:On the Integration of Optical Flow and Action Recognition Author:Facebook,Zhejiang University,MPI for Intelligent Systems,NVIDIA 0. 引言 在做视...

2018-07-02 23:06:22

阅读数 2524

评论数 0

【论文笔记】Non-local Neural Networks

Paper:https://arxiv.org/abs/1711.07971v1 Author:Xiaolong Wang, Ross Girshick, Abhinav Gupta, Kaiming He (CMU, FAIR) 0.简述 convolution和recurrent都是...

2018-06-26 21:34:50

阅读数 4055

评论数 1

【论文笔记】视频分类系列 Recognize Actions by Disentangling Components of Dynamics

Paper:http://openaccess.thecvf.com/content_cvpr_2018/papers/Zhao_Recognize_Actions_by_CVPR_2018_paper.pdf Anthor: Yue Zhao, Yuanjun Xiong, and Dahua...

2018-06-25 23:03:30

阅读数 658

评论数 3

【论文笔记】视频分类系列 Optical Flow Guided Feature: A Fast and Robust Motion Representation for Video (OFF)

Paper: Optical Flow Guided Feature: A Fast and Robust Motion Representation for Video Action Recognition (CVPR2018, SenseTime) 0. 简述 运动信息对于视频中动作的...

2018-06-24 21:44:45

阅读数 1552

评论数 1

【论文笔记】视频分类系列 Temporal Relational Reasoning in Videos (TRN)

Paper:https://arxiv.org/abs/1711.08496v1 Code:https://github.com/metalbubble/TRN-pytorch 作者:Bolei Zhou, Alex Andonian, Antonio Torralba (CSAIL, MIT...

2018-06-20 22:24:36

阅读数 3071

评论数 2

【论文笔记】CVPR2018 Detecting and Recognizing Human-Object Interactions

Paper:https://arxiv.org/abs/1704.07333 作者:Georgia Gkioxari, Ross Girshick, Piotr Dollár, Kaiming He。 从题目中看出这篇文章主要是研究人与物的互动。根据统计,CVPR2018中分析图像中的人类的有...

2018-06-19 22:39:57

阅读数 746

评论数 1

【论文笔记】视频分类系列 Appearance-and-Relation Networks for Video Classification (ARTNet)

时间空间域的特征学习对于视频分类来说很重要。文章提出了Appearance-and-Relation Networks(ARTNet)的结构,用于end-to-end地学习视频时间空间域的特征。 ARTNet是由多个名为SMART的block堆叠而成。SMART模块的目标是从RGB帧中分别学习到a...

2018-03-05 23:04:49

阅读数 1852

评论数 0

【论文笔记】视频分类系列 Temproal Segment Networks (TSN)

论文:https://arxiv.org/abs/1608.00859 代码:https://github.com/yjxiong/temporal-segment-networks1. 引言在视频分类中,对长时间域的建模有利于掌握整个视频的类别。而ConvNets擅长的是对appearance...

2018-03-04 22:16:29

阅读数 1457

评论数 0

【caffe源码笔记】VideoDataLayer解析

caffe中video_data_layer.cpp的解析,直接看代码中的注释。 // include的部分就不介绍了 #include <fstream> #include <iostream> #in...

2018-03-03 22:55:00

阅读数 609

评论数 1

Mac 挂载NTFS移动硬盘进行读写操作 Readonly file system

1. diskutil info /Volumes/YOUR_NTFS_DISK_NAME  找到 Device Node Device Node:              /dev/disk1s1 2. hdiutil eject /Volumes/YOUR_NTFS_DISK_NA...

2018-02-07 10:05:15

阅读数 5548

评论数 1

【论文笔记】视频物体检测(VID)系列 NoScope:1000x的视频检索加速算法

计算机视觉的进展,特别是近期深度神经网络的进展,使得在不断增长的视频数据中进行检索成为可能。但是,基于神经网络去做大规模视频检索,直接的问题就是计算量激增。比如现在最快的物体检测器能达到1~2.5x real time的效率(30~80fps),前提是买一个$4000的GPU。

2017-12-17 12:17:34

阅读数 718

评论数 2

【论文笔记】物体检测系列 SSD: Single Shot MultiBox Detector

一句话概述:SSD是One-stage的物体检测器,它是直接预测每个default box(在RCNN中称为anchor)是各物体类别的概率,并做回归。另外,SSD使用不同层的feature map来handle不同大小的物体。

2017-12-17 11:17:29

阅读数 1059

评论数 0

【论文笔记】物体检测系列 Light-Head R-CNN: In Defense of Two-Stage Object Detector

文章:https://arxiv.org/abs/1711.07264v1 这篇文章是旷视科技和清华大学联合出品的,主要是对其今年在COCO检测竞赛上的部分成果分享。他们总共拿下了 COCO Detection/Segmentation Challenge(检测/分割)、COCO Keypoin...

2017-12-03 17:27:35

阅读数 2004

评论数 1

C++ API载入tensorflow graph

通过C++ API载入tensorflow graph在tensorflow repo中,和C++相关的tutorial远没有python的那么详尽。这篇文章主要介绍如何利用C++来载入一个预训练好的graph,以便于单独使用或者嵌入到其他app中。Requirements 安装bazel:ten...

2017-12-03 16:19:33

阅读数 3298

评论数 0

Bazel入门2:C++编译常见用例

1. 在一个target中包含多个文件可以利用glob在单个target中包含多个文件,例如:cc_library( name = "build-all-the-files", srcs = glob(["*.cc"]) hdrs =...

2017-11-29 23:05:17

阅读数 2757

评论数 1

Bazel入门:编译C++项目

官网:https://www.bazel.build Github: https://github.com/bazelbuild/bazel最近用到tensorflow的时候遇到了个新的编译工具Bazel,踩了无数坑之后终于决定还是系统地学习一下这货。Bazel是一个类似于Make的编译工具,是...

2017-11-29 18:46:04

阅读数 19938

评论数 3

提示
确定要删除当前文章?
取消 删除
关闭
关闭