A君来了-CSDN博客

原创搞定目标检测（SSD篇）（下）

搞定目标检测（SSD篇）（上）主要分析了目标检测的基本原理和技术局限，本文将继续上集的未尽事宜，详解如何使用SSD搞定目标检测。先打个预防针，本文的内容会比较烧脑，最好结合代码和论文来理解，而且本文的阅读前提是默认你已经掌握了上集的内容，当然我也会尽量用通俗易懂的语言给你讲清楚。Github: https://github.com/alexshuang/pascal-voc-pytorch。S...

2019-01-16 15:46:30 1275

原创搞定目标检测（SSD篇）（上）

目标检测（Object Detection）的任务是找出图像中所有感兴趣的目标（物体），确定它们的位置和大小。由于各类物体有不同的形状、大小和数量，加上物体间还会相互遮挡，因此目标检测一直都是机器视觉领域中最具挑战性的难题之一。如上图所示，目标检测就是用一个矩形来定位一个物体并判断该物体是什么？现阶段，主流算法中表现最好的是SSD和YOLO，前者就是本文要用到的算法。实际上，不管是用SSD还...

2019-01-16 15:45:27 1464 7

原创用Unet实现图像分割（by pytorch）

SegmentationFigure1来自CamVid database，专为目标识别（Object Dection）和图像分割（Image Segmentation）提供训练数据的网站。从图中可以看出，segmentation将图像中不同个体用不同颜色来标记，这里不同的颜色就代表不同的分类，例如红色就是分类1，蓝色就是分类2，可以看出，它就是像素级的图像识别（Image Identifica...

2018-12-17 16:35:25 25126 3

原创 Faiss核心技术

OverviewFaiss是Facebook AI Research开发的快速相似性搜索（similarity search）计算库。所谓的相似性搜索，就是进行向量间比对，如图示，图像经过特征提取转换成一个高维向量，通过将该向量和数据库中其他图像特征向量作一一比对，就能找出最相近的K个目标图像。不仅是图像，只要是可以用高维向量表征的，都可以做相似性搜索，如文字、音频等。向量比对就是计算两向量间的距离，Faiss提供了两种方法：欧几里得距离(L2)和向量点积(IP)，前者是默认方法，它的计算结果值越小.

2021-07-13 09:38:05 455

原创深入浅出腾讯BERT推理模型--TurboTransformers

天下武功唯快不破，解读BERT推理模型关于快的秘密。

2020-06-27 09:04:32 760 2

原创深入浅出PyTorch（算子篇）

解读PyTorch的内部机制。

2020-06-25 09:44:05 6949

原创深入浅出Transformer

TransformerTransformer是NLP的颠覆者，它创造性地用非序列模型来处理序列化的数据，而且还获得了大成功。更重要的是，NLP真的可以“深度”学习了，各种基于transformer的模型层出不穷，如BERT、GPT-2、T-NLG，而且模型参数量呈指数级增长。Transformer之前，大家的思路都是在改进序列模型，从RNN到LSTM、GRU、Seq2Seq。如果你看过我之前写的深入浅出RNN就会知道，序列模型要靠遍历seq_len来处理data，效率低是显而易见的。不仅如此，深层网络.

2020-05-25 23:15:27 921

原创【Predict Future Sales】玩转销量预测 part2

本文是【Predict Future Sales】用深度学习玩转销量预测的续集，主要介绍另一个强大的机器学习算法–随机森林（Random Forest，下文简称RF）在销量预测实例中的应用。github: https://github.com/alexshuang/predict_future_sales/blob/master/predict_future_sale_rf.ipynbLook...

2019-03-06 19:49:02 1412

原创【论文解读】Concurrent Spatial and Channel `Squeeze & Excitation' in Fully Convolutional Networks

Paper这篇论文提出了一种称为scSE（Concurrent Spatial and Channel `Squeeze & Excitation’） block的神经网络，它可以应用在CNN的任意层，用于增强CNN编码空间信息（spatial encoding）能力，提高CNN的图像识别能力。在Kaggle image segmentation比赛–TGS Salt Ide...

2019-03-06 19:47:43 2763 1

原创【Kaggle Quick, Draw!】涂鸦识别，AI与你同在

Quick, Draw!是Google推出的一款很好玩的AI涂鸦游戏，玩家需要在20秒内画出指定内容，例如鸭子、冰箱、苹果等，它的神经网络会实时识别你的涂鸦。最近Google在kaggle上发布了优化QuickDraw预测识别能力的比赛，Quick, Draw! Doodle Recognition Challenge，本篇博文就来是分享涂鸦识别的心得。与以往同类比赛不同的是，这次的数据集规模...

2018-12-17 16:33:14 1605

原创【Predict Future Sales】用深度学习玩转销量预测

Kaggle上发布过各种类型的数据科学比赛中，以forecast类型的比赛占比最大、单场参赛人数最多，是kaggle的金牌大户，其内容包括像预测某公司/产品未来几月的收入/销量、预测商品的目标人群、根据大数据评估预测用户的还贷风险等。以今年的热门赛事为例，不管是创下单场参赛人数之最的Home Credit Default Risk，还是依旧进行中的Google Analytics Custom...

2018-11-09 23:50:08 2995

原创 CNN: 1x1卷积层的精妙之处

现在各种神经网络都会用到1x1 conv，它到底起到什么作用呢？要回答这个问题，先从最经典的Inception模型说起，Figure 1是Inception-ResNet-v2的block架构图。作用一：改变矩阵维度block中每个sublayer的第一层都1x1 conv，它在这里的作用之一是降维，减少运算量–feature map channel数越少，卷积操作需要的计算量越小。但就像...

2018-11-02 13:53:41 1155

原创 Style Transfer--AI在绘画领域上的应用

Part 1:Style Transfer是AI将不同风格和内容结合在一起从而创造出新艺术作品的技术。如Figure 1所示，将相机拍摄下的街景照片分别与梵高的《星空》、蒙克的《尖叫》以及透纳的《牛头人的沉船》结合在一起，创造出对应风格的油画作品。以梵高的《星空》为例，图c的内容和原始图像相近，除此之外天空中还呈现了《星空》中的月亮和星星，而绘画笔法上也继承了梵高的粗笔触，画面的整体色调和《...

2018-10-31 08:05:13 770

原创你真的明白神经网络是什么?

你真的明白神经网络是什么?神经网络是函数神经网络是Linearity + Non-Linearity损失函数是衡量逼近效果的量化工具手写体数字识别 / [Notebook](https://github.com/alexshuang/mnist_pytorch/blob/master/mnist_pytorch.ipynb)Dataset标准化（Normalization）ModelLoss Fu...

2018-10-31 07:58:22 615

cedi9117的博客