![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文翻译笔记
文章平均质量分 89
进击的煎饼果子
一入编程深似海,从此节操成路人.附上github主页
https://github.com/macqueen09
展开
-
Sequence to Sequence 经典必读两篇论文
Sequence to Sequence Learning with Neural Networks 论文Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation论文第一篇是Quoc V. Le 大神的2014年经典文章,引用量14161,只要涉及序列2序列,肯定要引用这篇文章,应用包括不限于语言翻译,音频识别,字符识别,序列识别等我分别概括下两篇开山论文的梗概Seq原创 2021-03-12 16:21:09 · 1735 阅读 · 0 评论 -
Fast multi-language LSTM-based online handwriting recognition 在线手写识别
Fast multi-language LSTM-based online handwriting recognition 在线手写识别paper在线手写识别,是区别于离线手写识别,即带书写轨迹的字符识别,比如平板,写字板等触摸屏活着触控笔等。带有笔迹时许信息。也区分单字识别(触屏输入法)和行识别(一次性写一行直接识别出来,666)本文是2019年的论文,我写一下论文概要谷歌的在线手写识别系统,在IAM-OnDB英文在线行识别数据集上最好。该系统将来自序列识别的方法与使用贝塞尔曲线的新输入编码相原创 2020-12-28 20:50:43 · 1017 阅读 · 0 评论 -
字符识别,口算题识别论文小梗概
口算题批改,在教育领域是一个比较实际的应用场景,小学生各种练习册中五花八门的数学口算题,写好答案之后通过拍照,自动批改,挑出题目中算错的题,提高作业正确率,大人小孩都需要。在小猿搜题等在线教育app里功能基本已经比较完备。口算题识别,说白了也就是特殊场景的字符识别,其中包括印刷体(题干)和手写体(作答内容)的混合识别。通过检测模型把口算题抠出来,然后送入识别模型得到字符,再判断题目是否作答正确。市面上常见的两个技术路线,腾讯使用ANMT,是基于2D attention单行多行统一的口算题识别模型。另原创 2020-11-26 15:50:28 · 1084 阅读 · 0 评论 -
为什么MobileNet及其变体(如ShuffleNet)会变快&什么时候会受限
Introduction在本文中,我概述了高效CNN模型(如MobileNet及其变体)中使用的组成部分(building blocks),并解释了它们如此高效的原因。特别地,我提供了关于如何在空间和通道域进行卷积的直观说明。在高效的模型中使用的组成部分在解释具体的高效CNN模型之前,我们先检查一下高效CNN模型中使用的组成部分的计算量,看看卷积在空间和通道域中是如何进行的。假设 H x W 为输出feature map的空间大小,N为输入通道数,K x K为卷积核的大小,M为输出通道数,则标准卷原创 2020-08-31 11:48:07 · 902 阅读 · 1 评论 -
YOLOv5 解读版本1——2020.8.20
YOLOv4 vs. YOLOv5data augmentation传统增强+CutOut在CNN第一层随机扔掉某一块Hide and seekMixUp按权重把两张图加一起CutMixcutout的区域加入另一张图的目标,应对遮挡问题,识别堆叠的目标物体Mosaic马赛克四张图片随机拼接成大图,缩放识别小物体缓解;batch压力class label smoothing引入均匀分布的噪声,平滑label,把类间距离放得更远了(原本只关注类内,不关注类间)对比YOLOv3原创 2020-08-20 20:51:20 · 3466 阅读 · 0 评论 -
CenterNet: Objects as Points论文解读 目标检测、关键点检测论文及代码
先占个坑,之后肯定补(和博客里其他人TODO list然后就消失的那种不一样的)2020.5.14论文https://arxiv.org/pdf/1904.07850.pdf原创 2020-05-15 08:57:36 · 1522 阅读 · 3 评论 -
谷歌的手势识别pipeline
论文https://arxiv.org/abs/1701.01779使用自上而下,Faster R-CNN改版进行行人检测。ResNet101+空洞卷积+更密集的feature map对检测区域进行单人姿态估计。其中有几个细节:不仅局限于行人包围框来预测关键点使用预测出的关键点对BBox重新打分高于0.3分的proposals才进行关键点计算,平均每张图3.5个proposals...原创 2020-05-06 15:41:34 · 999 阅读 · 0 评论 -
MobileNet网络系列论文及模型V1-V2-V3
MobileNet V1基于一种使用深度可分割卷积去建立轻量型网络结构的流线型结构。引进了两个简单的超参数,这两个超参数在延迟和准确率方面达到了平衡,宽度因子和分辨率因子。之前的网络要么大模型压缩为小模型;要么训练小模型。我们可以通过超参可调网络大小(有些论文只考虑模型规模,没直接考虑模型速度)结构深度可分离卷积Depthwise Separable Convolution将标准卷积分...原创 2020-04-08 11:34:05 · 1791 阅读 · 0 评论 -
CVPR2020 实例分割
实例分割Hao Chen陈昊 CVPR2020 BlendMask实例分割COCO上评价指标 mAP 每个实例,每张图选100个结果AP:每个结果与GT算IOU 0.5:0.05:0.95 十个取平均COCO泛化性好,不容易过拟合缺:COCO标注不过精细但是这个评价指标没有对更关注边界像素的情况,只是检测的IOU迁移过来的Cascade R-CNN , Mask R...原创 2020-03-25 23:15:23 · 2599 阅读 · 0 评论 -
周博磊.Phd《强化学习》课程
视频课链接github链接纲要Overview一个【agent】在不确定的【环境】中极大化自己的【奖励】agent并没有立刻获得反馈(不像有监督学习一次分类后就能有正确错误的反馈)与监督学习的对比:是序列的数据,并不是iid分布learner不得不自己发现某些行为,因为很多步之后才能看出奖励需要不断试错(需要在exploration exploitation之间平衡)没有sup...原创 2020-03-18 17:28:33 · 618 阅读 · 0 评论 -
面试过程中,机器学习中常见的最优化算法
目录机器学习中常见的最优化算法机器学习中常见的最优化算法原创 2020-03-02 15:31:41 · 274 阅读 · 0 评论 -
Batch Normalization论文翻译
Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift五次面试有三次会问到BN层,这个点一定要从前世今生都吃透啊!论文超链接:https://arxiv.org/pdf/1502.03167v3.pdfAbstract通过要求较低的学习率和仔细的参数初始化减慢了...原创 2020-03-01 00:44:24 · 412 阅读 · 0 评论 -
旷世:高效准确的文字检测
EAST文字检测网络可以以很小的计算量,加在其他backbone之后改善检测效果主讲人赵明明具体,性能和准确率fscore 0.757 , fps 16.8 ,PVANet fps 16.8channel乘以2倍,fps13.2FCN+NMSEAST 详细 pipellinefeature mergingconv stage 包括conv pooling等、多层...原创 2020-02-28 23:42:25 · 463 阅读 · 0 评论 -
人脸对齐 旷世讲座
人脸识别系统应用:一人脸确认1V1确认是否是一个人二人脸ID1VN 大库里找到输入图片是谁人脸->特征向量想让不同的向量拥有“相似度”概念类内距离;类间距离单张图经过人脸识别的pipeline人脸检测人脸关键点定位Landmark人脸对齐Alignment(用来降低人脸几何形变,降低识别系统的复杂度)人脸识别(得到特征向量)要有这么一个函数图像空间->...原创 2020-02-27 21:01:58 · 509 阅读 · 0 评论 -
推荐系统在直播场景的应用(花椒直播)
推荐系统:帮助用户发现内容,克服信息过载通过分析用户行为,对用户兴趣建模,预测用户的兴趣早期,基于热度推荐:热度高的一般质量有保证,但是集中在头部,难以千人千面现代化推荐系统全样本,生成粗排序(百万),再生成精致排序(几百个),在推荐给用户(10量级)召回与排序。召回基于邻域的协同过滤1计算用户与物品的相似度矩阵2计算出用户对缺失物品的得分早期使用:基于主播的协同过滤由于是n...原创 2020-02-20 22:10:48 · 802 阅读 · 0 评论 -
目标检测论文核心思想,18-19-20年论文梗概
论文太多来不及看,有些论文用了很大篇幅印证了某种模块有用或者没用,对于不研究这部分的人来说了解一下结论,这个模块有什么优缺点就够了。因而记录一下2018-2019-2020这几年泛读的论文梗概:文章目录DetNet: A Backbone network for Object DetectionDetNet: A Backbone network for Object Detection论文...原创 2020-01-08 20:04:58 · 486 阅读 · 0 评论 -
Distribution-Aware Coordinate Representation for Human Pose Estimation 姿态估计 CVPR2019
Distribution-Aware Coordinate Representation for Human Pose Estimation 姿态估计 CVPR2019 论文翻译,学习笔记,论文梗概论文原文点这这篇文章是该团队基于2018年工作的改进,2018年那个论文翻译点这Abstract姿态估计使用热度图来定位已成为惯例,但是据作者所知并没有文献对热度图进行系统的研究,本文将填补这个...原创 2020-01-07 10:52:41 · 4200 阅读 · 0 评论 -
FPD: Fast Human Pose Estimation 姿态估计cvpr2019论文阅读
from 电子科技大学姿态估计CVPR2019论文地址升级版论文Abstract姿态估计精度方面越来越好,但是网络越来越大。想通过减少少量精度得到一个可以在轻量级设备上运行的模型。使用一个 Fast Pose Distillation (FPD)。在强teacher network中学习一个小网络。在MPII和Leeds Sports Pose(LSP)上取得了很有效的效果Intro...原创 2020-01-04 18:01:14 · 2055 阅读 · 0 评论 -
图像对齐讲座—旷世成都研究院 & 数据策略产品经理——阿里讲座
刘帅成博士,旷世成都研究院,该院2018年成立,新加坡国立大学毕业目录:1基于传统算法2基于深度学习3基于硬件Image aligment methods图像对齐应用:图片拼接:不同视角拍的建筑拼成更大的一个画面,全景图去噪,防抖HDR不同曝光的同一场景,选取不同的曝光区域 拼接多摄像头协同工作,一个是长焦,一个是广角。视频防抖。挑战:1 重复特征:大厦窗口纹理很像,...原创 2019-12-18 21:21:29 · 1564 阅读 · 0 评论 -
讲座笔记:模型量化-更小更快更强 Dance with Bit ———哈佛大学.董鑫PHD
Dance with Bitrecord in 2019/11/21Quantization定长和变长精度:两个数字之间最小差别能有多小 32位单精度: 1.2*12^-38量化:浮点数->定点数:压缩网络的方法 Quantization矩阵的分解X= TP X是大矩阵100100 ,一共10000个, T是1002 P是2100 , 一共400 个参数只是内存优...原创 2019-11-21 22:28:55 · 310 阅读 · 0 评论 -
Learning Efficient Single-stage Pedestrian Detectors by Asymptotic Localization Fitting行人检测ECCV2018
Learning Efficient Single-stage Pedestrian Detectors by Asymptotic Localization Fitting 行人检测论文,ECCV2018代码地址论文地址Wei Liu 1,3(国防科大) , Shengcai Liao 1,2(中国科学院大学)原来是学长的论文呀,66666概要:虽然基于two-stage的检测器Fast...原创 2019-11-14 21:27:38 · 506 阅读 · 0 评论 -
数据结构 C++语言版 清华大学第三版 学习笔记
绪论绪论一道冒泡排序拍懵我了,我以为O(n2)O(n^2)O(n2) 复杂度的经典冒泡排序没有优化空间了,结果一个bool标识打脸,可以提前终止冒泡,如果已经是按顺序了的数组的话: void bubblesort1A(int A[], int n) { //起泡排序算法(版本1A):0 <= n bool sorted = false; //整体排序标志,首先假定尚未排序 ...原创 2019-10-29 22:50:55 · 903 阅读 · 1 评论 -
《视频理解中的神经网络结构设计》讲座笔记 作者:邱钊凡
从视频动作识别、定位等多方面介绍网络结构带来的不同。作者 邱钊凡中国科学技术大学,在读博士生目录1. 第一部分:视频特征提取 Pseudo-3D残差网络 Local and Global Diffusion网络2. 第二部分:视频理解视频动作识别Local and Global Diffusion网络空间动作定位时域动作检测3. 第三部分:总结原创 2019-10-17 19:59:28 · 609 阅读 · 0 评论 -
《如何打造复杂的产品系统》讲座笔记 作者:潘一鸣
《如何打造复杂的产品系统》讲座,针对产品经理视角,作者潘一鸣为新东方在线高级产品经理,《产品逻辑之美》作者作者简历清华本科毕业,先后就就职于网易科技、 聚美优品、滴滴出行、字节跳动、 新东方在线(带领团队做业务)本文中包括聚美优品(千人千面)、滴滴出行(豪华车分单)两个案例中产品如何打磨出来的案例原创 2019-10-09 21:32:45 · 734 阅读 · 0 评论 -
AlphaPose姿态估计论文翻译和代码解读RMPE: Regional Multi-Person Pose Estimation
姿态估计模型AlphoPose模型的论文 或者论文V3版 ICCV2017接收,上海交大和腾讯优图的妏代码 ,基于pytorch或者Tensorflow如果想了解姿态估计的简单概述,可以点击我的另一篇综述文章RMPE: Regional Multi-Person Pose EstimationAbstract自然场景的多人姿态估计是一个极大的挑战。虽然最好的人类检测器已经有很好的效果了...原创 2019-10-29 11:31:35 · 8260 阅读 · 3 评论 -
拥挤场景多人姿态估计论文梗概及代码CrowdPose: Efficient Crowded Scenes Pose Estimation and A New Benchmark
姿态估计是视频动作分析识别的基础工作,我有一篇小综述讲了姿态估计相关技术路线的发展,可以点这个链接看。本文是MVIG大佬们发表在CVPR2019上的一篇论文,上号交通大学,基于AlphaPose思路,进一步提升了拥挤情况下准度代码:github点这,基于Pytorch,是实时多人姿态估计系统论文:论文点这论文第二版点这Abstract多人姿态估计是大量计算机视觉任务的基础,近年来也取得...原创 2019-10-28 20:49:53 · 1183 阅读 · 0 评论