自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 搞定目标检测(SSD篇)(下)

搞定目标检测(SSD篇)(上)主要分析了目标检测的基本原理和技术局限,本文将继续上集的未尽事宜,详解如何使用SSD搞定目标检测。先打个预防针,本文的内容会比较烧脑,最好结合代码和论文来理解,而且本文的阅读前提是默认你已经掌握了上集的内容,当然我也会尽量用通俗易懂的语言给你讲清楚。Github: https://github.com/alexshuang/pascal-voc-pytorch。S...

2019-01-16 15:46:30 1275

原创 搞定目标检测(SSD篇)(上)

目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标(物体),确定它们的位置和大小。由于各类物体有不同的形状、大小和数量,加上物体间还会相互遮挡, 因此目标检测一直都是机器视觉领域中最具挑战性的难题之一。如上图所示,目标检测就是用一个矩形来定位一个物体并判断该物体是什么?现阶段,主流算法中表现最好的是SSD和YOLO,前者就是本文要用到的算法。实际上,不管是用SSD还...

2019-01-16 15:45:27 1464 7

原创 用Unet实现图像分割(by pytorch)

SegmentationFigure1来自CamVid database,专为目标识别(Object Dection)和图像分割(Image Segmentation)提供训练数据的网站。从图中可以看出,segmentation将图像中不同个体用不同颜色来标记,这里不同的颜色就代表不同的分类,例如红色就是分类1,蓝色就是分类2,可以看出,它就是像素级的图像识别(Image Identifica...

2018-12-17 16:35:25 25126 3

原创 Faiss核心技术

OverviewFaiss是Facebook AI Research开发的快速相似性搜索(similarity search)计算库。所谓的相似性搜索,就是进行向量间比对,如图示,图像经过特征提取转换成一个高维向量,通过将该向量和数据库中其他图像特征向量作一一比对,就能找出最相近的K个目标图像。不仅是图像,只要是可以用高维向量表征的,都可以做相似性搜索,如文字、音频等。向量比对就是计算两向量间的距离,Faiss提供了两种方法:欧几里得距离(L2)和向量点积(IP),前者是默认方法,它的计算结果值越小.

2021-07-13 09:38:05 455

原创 深入浅出腾讯BERT推理模型--TurboTransformers

天下武功唯快不破,解读BERT推理模型关于快的秘密。

2020-06-27 09:04:32 760 2

原创 深入浅出PyTorch(算子篇)

解读PyTorch的内部机制。

2020-06-25 09:44:05 6949

原创 深入浅出Transformer

TransformerTransformer是NLP的颠覆者,它创造性地用非序列模型来处理序列化的数据,而且还获得了大成功。更重要的是,NLP真的可以“深度”学习了,各种基于transformer的模型层出不穷,如BERT、GPT-2、T-NLG,而且模型参数量呈指数级增长。Transformer之前,大家的思路都是在改进序列模型,从RNN到LSTM、GRU、Seq2Seq。如果你看过我之前写的深入浅出RNN就会知道,序列模型要靠遍历seq_len来处理data,效率低是显而易见的。不仅如此,深层网络.

2020-05-25 23:15:27 921

原创 【Predict Future Sales】玩转销量预测 part2

本文是【Predict Future Sales】用深度学习玩转销量预测的续集,主要介绍另一个强大的机器学习算法–随机森林(Random Forest,下文简称RF)在销量预测实例中的应用。github: https://github.com/alexshuang/predict_future_sales/blob/master/predict_future_sale_rf.ipynbLook...

2019-03-06 19:49:02 1412

原创 【论文解读】Concurrent Spatial and Channel `Squeeze & Excitation' in Fully Convolutional Networks

Paper这篇论文提出了一种称为scSE(Concurrent Spatial and Channel `Squeeze & Excitation’) block的神经网络,它可以应用在CNN的任意层,用于增强CNN编码空间信息(spatial encoding)能力,提高CNN的图像识别能力。在Kaggle image segmentation比赛–TGS Salt Ide...

2019-03-06 19:47:43 2763 1

原创 【Kaggle Quick, Draw!】涂鸦识别,AI与你同在

Quick, Draw!是Google推出的一款很好玩的AI涂鸦游戏,玩家需要在20秒内画出指定内容,例如鸭子、冰箱、苹果等,它的神经网络会实时识别你的涂鸦。最近Google在kaggle上发布了优化QuickDraw预测识别能力的比赛,Quick, Draw! Doodle Recognition Challenge,本篇博文就来是分享涂鸦识别的心得。与以往同类比赛不同的是,这次的数据集规模...

2018-12-17 16:33:14 1605

原创 【Predict Future Sales】用深度学习玩转销量预测

Kaggle上发布过各种类型的数据科学比赛中,以forecast类型的比赛占比最大、单场参赛人数最多,是kaggle的金牌大户,其内容包括像预测某公司/产品未来几月的收入/销量、预测商品的目标人群、根据大数据评估预测用户的还贷风险等。以今年的热门赛事为例,不管是创下单场参赛人数之最的Home Credit Default Risk,还是依旧进行中的Google Analytics Custom...

2018-11-09 23:50:08 2995

原创 CNN: 1x1卷积层的精妙之处

现在各种神经网络都会用到1x1 conv,它到底起到什么作用呢?要回答这个问题,先从最经典的Inception模型说起,Figure 1是Inception-ResNet-v2的block架构图。作用一:改变矩阵维度block中每个sublayer的第一层都1x1 conv,它在这里的作用之一是降维,减少运算量–feature map channel数越少,卷积操作需要的计算量越小。但就像...

2018-11-02 13:53:41 1155

原创 Style Transfer--AI在绘画领域上的应用

Part 1:Style Transfer是AI将不同风格和内容结合在一起从而创造出新艺术作品的技术。如Figure 1所示,将相机拍摄下的街景照片分别与梵高的《星空》、蒙克的《尖叫》以及透纳的《牛头人的沉船》结合在一起,创造出对应风格的油画作品。以梵高的《星空》为例,图c的内容和原始图像相近,除此之外天空中还呈现了《星空》中的月亮和星星,而绘画笔法上也继承了梵高的粗笔触,画面的整体色调和《...

2018-10-31 08:05:13 770

原创 你真的明白神经网络是什么?

你真的明白神经网络是什么?神经网络是函数神经网络是Linearity + Non-Linearity损失函数是衡量逼近效果的量化工具手写体数字识别 / [Notebook](https://github.com/alexshuang/mnist_pytorch/blob/master/mnist_pytorch.ipynb)Dataset标准化(Normalization)ModelLoss Fu...

2018-10-31 07:58:22 615

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除