嵌入式视觉-CSDN博客

原创轻量级模型设计与部署总结

轻量级网络的手动设计目前还没用广泛通用的准则，只有一些指导思想，和针对不同芯片平台（不同芯片架构）的一些设计总结，建议大家从经典论文中吸取指导思想和建议，然后自己实际做各个硬件平台的部署和模型性能测试。

2022-11-24 02:07:01 3172 42

原创 FasterTransformer 框架速览

FasterTransformer 包含 Transformer 块的高度优化版本的实现，其中包含编码器 Encoder 和解码器 Decoder部分。基于 FT 可以运行完整的编码器-解码器架构模型

2023-07-27 11:15:00 470 2

原创 LLM 基础-transformers 库快速入门

本文总结了 Transformers 的常用术语并给出详细解释，然后对 transformers 库总结了快速使用方法，并结合实例代码做分析，可当作 LLM 的快速入门学习。

2023-07-26 20:02:59 825

原创 python3 面试题总结

python 经典面试题总结，大厂面试必备

2023-05-16 15:03:45 1172 1

原创 DeepSpeed通过系统优化加速大模型推理

LLM 的高效推理是实现 LLM工程应用的关键技术。和 LLM 训练环节相比，推理环节在计算精度（FP16/INT8）、算力消耗量等方面的要求较低，但 GPU 显存不足的问题同样会出现在推理环节。此外，模型推理速度受限于通信延迟和硬件内存带宽。如何保持低延迟的前提下，还尽可能节省计算资源和使现有显存满足推理的要求，是我们依然面临的问题。

2023-05-16 10:45:00 1205

原创海思 NNIE 芯片开发笔记

NNIE 是Neural Network Inference Engine 的简称，是海思媒体 SoC 中专门针对神经网络特别是深度学习卷积神经网络进行加速处理的硬件单元，可以理解为 CNN 加速器。

2023-04-26 14:15:31 1110

原创 NCNN 模型推理详解及实战

本文首先描述了 ncnn 推理框架的依赖库的知识，及相关 cpu 和内存硬件特性描述。最后结合 shufflenet sample 解析了，模型推理的全部流程，详解了 sample 代码的每个细节。

2023-04-26 14:13:45 998

原创 BLOOM模型结构详解

BLOOM模型也是 Decoder-only 架构，但和原始 decoder 结构主要有两个区别: ALiBi Positional Embeddings 和 Embedding LayerNorm。

2023-04-18 17:42:59 1810

原创经典transformer视觉模型总结

ViT 在 Transformer 架构的视觉模型的地位类似 ResNet模型。因为其模型“简单”且效果好，可扩展性强（scalable，模型越大效果越好），是Transformer在CV的奠基之作。

2023-04-16 10:30:00 839

原创 Transformer模型详解及代码实现

本文详细解析了Transformer整体模型结构，并深入分析了各个layer层的原理及给出了计算公式，针对每个 layer、block 都给出了较为详细的代码实现方便深入理解网络结构。

2023-04-15 10:30:00 1701

原创 LLM背景知识总结

在自然语言处理中，Token 是指一段文本中的基本单位，通常是一个词、一个词组或者一个字符。Tokenization 是将一段文本分解为一系列的 Token 的过程。

2023-04-14 17:34:50 837

所谓量化，其实可以等同于低精度（Low precision）概念，常规模型精度一般使用 FP32（32 位浮点数，单精度）存储模型权重参数，低精度则表示使用 INT8、FP16 等权重数值格式。模型量化（Model Quantization，也叫网络量化）过程分为两部分：将模型的单精度参数（一般 FP32-32位浮点参数）转化为低精度参数（一般 INT8-8 位定点参数），以及模型推理过程中的浮点运算转化为定点运算，这个需要推理框架支持。

2023-03-25 16:46:54 686

原创 ssh 远程连接方式总结

SSH（安全外壳协议 Secure Shell Protocol，简称SSH）是一种加密的网络传输协议，用于在网络中实现客户端和服务端的连接，典型的如我们在本地电脑通过 SSH 连接远程服务器。

2023-03-06 19:42:13 4192

原创基于pytorch实现模型剪枝

所谓模型剪枝，其实是一种从神经网络中移除"不必要"权重或偏差（weigths/bias）的模型压缩技术。本文深入描述了 pytorch 框架的几种剪枝 API，包括函数功能和参数定义，并给出示例代码。

2023-02-24 16:42:12 1393 4

原创深度学习模型压缩方法概述

模型压缩算法旨在将一个大模型转化为一个精简的小模型。工业界的模型压缩方法有：知识蒸馏、轻量化模型架构、剪枝、量化。

2023-02-24 16:38:57 550

原创万字长文概述单目3D目标检测算法

基于深度学习的主流单目3D目标检测算法可以分为两个过程：2D目标检测 + 基于投影几何原理的回归网络设计。本文首先介绍了单目 3D 目标检测的理论基础-投影几何原理和算法原理，并解读了几个主流模型。

2023-02-23 16:19:31 4676 1

原创 ResNet网络详解

残差网络(ResNet)的提出是为了解决深度神经网络的“退化”（优化）问题。ResNet 通过设计残差块结构，调整模型结构，让更深的模型能够有效训练更训练。

2023-02-23 16:15:40 1445 2

原创模型压缩-剪枝算法详解

模型剪枝是应用非常广的一种模型压缩方法，其可以直接减少模型中的参数量。本文会对模型剪枝的定义、发展历程、分类以及算法原理进行详细的介绍。

2023-02-23 15:58:21 952

原创 Backbone 网络-ResNet 论文解读

摘要残差网络(ResNet)的提出是为了解决深度神经网络的“退化”(优化)问题。有论文指出，神经网络越来越深的时候，反传回来的梯度之间的相关性会越来越差，最后接近白噪声。即更深的卷积网络会产生梯度消失问题导致网络无法有效训练。而 ResNet 通过设计残差块结构，调整模型结构，让更深的模型能够有效训练更训练。目前 ResNet 被当作目标检测、语义分割等视觉算法框架的主流 backbone...

2023-02-22 21:27:00 156

原创互联网技术大佬独立博客推荐

1，bang's blog17 年就是蚂蚁金服 P8 的前端大佬。博客质量基本都很高，看他的文章会让我得到些思考，比如文章中的 “心流”(我的叫法跟他的不一样，但内核一样)的描述，我之前也有过类似的状态，但只有一次，就是高三临场抱佛脚，花了 3 周让自己的排名进步了近 1000 名的复习经历，可惜这种状态太难得了，他首先需要的就是无与伦比的专注！2，Guibo Wang blog腾讯广告...

2023-02-20 20:15:00 306

原创神经网络基础部件-卷积层详解

本文深度讲解了卷积计算的原理，并详细介绍了构成所有卷积网络主干的基本元素，包括卷积层本身、填充(padding)和步幅 (stride)的基本细节、用于在相邻区域汇聚信息的汇聚层(pooling)，最后给出卷积层和汇聚层的代码示例和CNN框架结构图。

2023-02-16 12:00:00 2190

原创机器学习经典算法总结

K 近邻算法（KNN）是一种基本分类和回归方法。KNN 算法的核心思想是如果一个样本在特征空间中的 k 个最相邻的样本中的大多数属于一个类别，那该样本也属于这个类别，并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分类样本所属的类别。

2023-02-14 18:30:00 653

原创机器学习入门知识总结

交叉验证是机器学习当中的概念，一般深度学习不会使用交叉验证方法，原因是深度学习的数据集一般都很大。但是也有例外，Kaggle 的一些医疗类比赛，训练集一般只有几千张，由于训练数据很少，用来作为验证集的数据会非常少，因此训练的模型在验证集上精度可能会有很大波动，这直接取决于我们所选择的验证集和训练集划分方式，也就是说，验证集的划分方式可能会造成验证集精度存在较大方差，从而无法对模型进行有效评估，同时也无法进行有效的超参数调整（batch 设置多少模型最佳收敛）。

2023-02-13 10:30:00 1267

原创机器学习基本概念总结

模型容量是指模型拟合各种函数的能力，决定了模型是欠拟合还是过拟合。欠拟合就是指模型的训练误差过大，即偏差过大，表现为模型不够”准“，优化算法目的在于解决欠拟合问题。过拟合就是指训练误差和测试误差间距过大，即方差过大，表现为模型不够”稳“，正则化目的在于解决过拟合问题。机器学习模型的目的是解决欠拟合和过拟合的问题，这也是机器学习算法的两个挑战。

2023-02-12 10:15:00 650

原创机器学习基本原理总结

深度学习是机器学习的一个特定分支。我们要想充分理解深度学习，必须对机器学习的基本原理有深刻的理解。大部分机器学习算法都有超参数（必须在学习算法外手动设定）。机器学习本质上属于应用统计学，其更加强调使用计算机对复杂函数进行统计估计，而较少强调围绕这些函数证明置信区间；因此我们会探讨两种统计学的主要方法: 频率派估计和贝叶斯推断。同时，大部分机器学习算法又可以分成监督学习和无监督学习两类；本文会介绍这两类算法定义，并给出每个类别中一些算法示例。

2023-02-11 10:00:00 1924

原创《机器学习》学习笔记

查准率和查全率是一对矛盾的的度量。一般来说，查全率高时，查准率往往偏低；而查全率高时，查准率往往偏低。通常只有在一些简单任务中，才可能使查全率和查准率都很好高。精准率和召回率的关系可以用一个 P-R 图来展示，以查准率 P 为纵轴、查全率 R 为横轴作图，就得到了查准率－查全率曲线，简称 P-R 曲线，PR 曲线下的面积定义为 AP。

2023-02-10 20:21:04 834

原创神经网络基础部件-BN层详解

训练深度神经网络的复杂性在于，因为前面的层的参数会发生变化导致每层输入的分布在训练过程中会发生变化。这又导致模型需要需要较低的学习率和非常谨慎的参数初始化策略，从而减慢了训练速度，并且具有饱和非线性的模型训练起来也非常困难。网络层输入数据分布发生变化的这种现象称为内部协变量转移，BN 就是来解决这个问题。

2023-02-10 10:00:00 623

原创深度学习基础-机器学习基本原理

深度学习是机器学习的一个特定分支。我们要想充分理解深度学习，必须对机器学习的基本原理有深刻的理解。本文大部分内容参考《深度学习》书籍，从中抽取重要的知识点，并对部分概念和原理加以自己的总结，适合当作原书的补充资料阅读，也可当作快速阅览机器学习原理基础知识的参考资料。

2023-02-08 09:30:00 691

原创阿里云产品-智能语音交互快速测评

一，产品概述阿里云的智能语音交互产品提供语音识别、语音合成、自然语言理解等技术，实现“能听、会说、懂你”式的智能人机交互体验，适用于智能客服、质检、会议纪要、实时字幕等多个企业应用场景。其主要有以下优势：定制识别及发音：可用于客服、阅读、虚拟人等场景易接入：并提供API和多种SDK识别准确率高：持续迭代提升响应速度快：低延迟，秒级处理返回语音识别结果二，产品在线使用2.1，开...

2023-02-08 02:28:00 292

原创阿里云产品-图像搜索快速测评

背景知识什么是云计算对于纯新人，首先我们需要了解下什么是云计算。所谓云计算，就是指通过互联网，以按需服务的形式提供计算资源。这样企业就无需自行采购、配置或管理资源，而且只需要为实际使用的资源付费。通俗来讲，就是将实体物理计算机提供的各种服务搬到了线上，这样即使我们没有实体电脑也能体验和使用一些计算资源，比如：云服务器、云数据库、人工智能相关服务等。阿里云产品阿里云计算提供的热门产品包括...

2023-02-07 20:58:00 194

原创深度学习炼丹-数据标准化

当我们处理的数据具有不同尺度时，执行数据标准化操作是很有必要的。本文给出了数据标准化(Normalization)的定义、常用方法以及为什么要做数据标准化，并给出相关代码实现。最后将Normalization概念应用于图像领域，并给出实现的相关细节以及示例代码。

2023-02-07 01:25:04 2106 2

原创机器学习入门总结

一，机器学习概述1.1，机器学习分类1.2，机器学习任务二，线性模型2.1，基本形式2.2，线性回归2.3，多分类学习2.4，类别不平衡问题三，数据清洗与特征处理3.1，清洗标注数据3.2，特征分类3.3，特征处理与分析四，数据预处理基础4.1，如何处理数据中的缺失值参考资料一，机器学习概述1.1，机器学习分类所谓机器学习，是关于在计...

2023-02-07 00:03:00 65

原创深度学习基础-优化算法详解

所谓深度神经网络的优化算法，即用来更新神经网络参数，并使损失函数最小化的算法。优化算法对于深度学习非常重要，如果说网络参数初始化（模型迭代的初始点）能够决定模型是否收敛，那优化算法的性能则直接影响模型的训练效率。了解不同优化算法的原理及其超参数的作用将使我们更有效的调整优化器的超参数，从而提高模型的性能。

2023-02-04 00:46:57 1424

原创反向传播与梯度下降详解

梯度下降（gradient descent, GD）算法是神经网络模型训练中最为常见的优化器。尽管梯度下降(gradient descent)很少直接用于深度学习，但理解它是理解随机梯度下降和小批量随机梯度下降算法的基础。

2023-02-04 00:44:38 2181

原创深度学习基础-网络参数初始化详解

神经网络模型一般是依靠随机梯度下降优化算法进行神经网络参数更新的，而神经网络参数学习是非凸问题，利用梯度下降算法优化参数时，网络权重参数的初始值选取十分关键。首先得明确的是现代的网络参数初始化策略是简单的、启发式的。设定改进的初始化策略是一项困难的任务，因为神经网络优化至今还未被很好地理解（即模型训练过程是一个黑盒）。

2023-02-02 17:35:01 493

原创随机梯度下降法的数学基础

梯度是微积分中的基本概念，也是机器学习解优化问题经常使用的数学工具（梯度下降算法）。因此，有必要从头理解梯度的来源和意义。本文从导数开始讲起，讲述了导数、偏导数、方向导数和梯度的定义、意义和数学公式，有助于初学者后续更深入理解随机梯度下降算法的公式。大部分内容来自维基百科和博客文章内容的总结，并加以个人理解。

2023-01-18 15:28:15 538

原创机器学习基本原理

前言5.1 学习算法5.1.1 任务 \(T\)5.1.2 性能度量 \(P\)5.1.3 经验 \(E\)5.1.4 示例: 线性回归5.2 容量、过拟合和欠拟合5.2.1 没有免费午餐定理5.2.2 正则化5.3 超参数和验证集5.3.1 验证集的作用5.3.2 交叉验证5.4 估计、偏差和方差5.4.1 点估计5.4.2 偏差5.4.3 ...

2023-01-17 20:32:00 59

原创深度学习基础-损失函数详解

损失函数定义：损失函数是深度学习模型训练过程中关键的一个组成部分，其通过前言的内容，我们知道深度学习算法优化的第一步首先是确定目标函数形式。损失函数大致可分为两种：回归损失（针对连续型变量）和分类损失（针对离散型变量）。常用的减少损失函数的优化算法是“梯度下降法”（Gradient Descent）。

2023-01-14 14:20:14 1874 2

原创一文搞懂视频编解码原理

一，基本术语1.1，颜色亮度和我们的眼睛二，视频编码的实现原理2.1，视频编码技术概述2.2，帧类型2.3，帧内编码(帧内预测)2.4，帧间编码(帧间预测)三，实际的视频编码器如何工作3.1，视频容器(视频数据封装)3.2，编码器发展历史3.3，通用编码器工作流程3.3.1，第一步-图片分区3.3.2，第二步-预测3.3.3，第三步-转换3.3.4，...

2023-01-12 14:12:00 356

原创《数字图像处理》学习笔记

文章首发于我的 github 仓库-cv算法工程师成长之路，欢迎关注我的公众号-嵌入式视觉。一，绪论1.1, 什么是数字图像处理1.2，数字图像处理的起源1.3，数字图像处理技术应用实例1.4，数字图像处理的基本步骤1.5，图像处理系统的组成二，数字图像基础2.1，视觉感知要素2.1.1，人眼的结构2.1.2，人眼中图像的形成2.1.3，亮度适应与辨别...

2023-01-11 14:33:00 287

I2C总线说明书

关于ISD4004语音芯片资料

空空如也