自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 资源 (2)
  • 收藏
  • 关注

原创 什么是Foundation Models(基础模型)?

Foundation Models代表了人工智能发展的一个重要方向,凭借其强大的泛化能力和广泛的应用前景,已经成为AI研究和应用的核心工具。未来,随着技术的不断进步,我们有理由相信Foundation Models将为更多行业带来变革性的影响。希望本文对您了解Foundation Models有所帮助。如果您有任何疑问或想法,欢迎在评论区交流讨论。

2024-07-12 14:33:22 298

原创 ViT(Vision Transformer)简介

线性投影z0ixpiEz0i​xpi​E位置编码z0ixpiEEposiz0i​xpi​EEposi​自注意力机制AttentionQKVsoftmaxQKTdkVAttentionQKVsoftmaxdk​​QKT​V我们使用的是Kaggle上的皮肤病变分类数据集,该数据集包含各种类型的皮肤病变图像,每个图像都标注了具体的病变类型。我们将使用ViT模型对这些图像进行分类。

2024-07-12 13:54:26 442

原创 LoRA:低秩适配的深度学习模型简介

在深度学习中,特别是自然语言处理(NLP)领域,预训练语言模型(如GPT、BERT等)已经取得了显著的成果。然而,这些模型通常具有数亿甚至数百亿的参数,在进行特定任务的微调时,所需的计算资源和存储需求非常庞大。LoRA 的提出正是为了解决这一问题。

2024-07-11 11:48:30 561 1

原创 什么是RLHF(基于人类反馈的强化学习)?

基于人类反馈的强化学习(RLHF)是一种结合强化学习和人类反馈的技术,通过人类对智能体行为的评价,指导智能体的学习过程,使其行为更符合人类期望。本文通过公式、通俗易懂的示例和简化的代码解释了RLHF的基本原理和实现方法,并介绍了一些常用的技巧,以帮助读者更好地理解和应用这一技术。希望这些内容能够为读者提供有价值的参考。

2024-07-11 11:36:01 552 1

原创 大模型应用中什么是SFT(监督微调)?

监督微调(Supervised Fine-Tuning, SFT)是对已经预训练的模型进行特定任务的训练,以提高其在该任务上的表现。预训练模型通常在大量通用数据上进行训练,学到广泛的语言知识和特征。在SFT过程中,利用特定任务的数据,对模型进行进一步调整,使其更适合该任务。监督微调(SFT)通过使用特定任务的数据集对预训练模型进行进一步训练,从而优化模型在该任务上的性能。这种方法在自然语言处理领域有广泛的应用,如文本分类、问答系统和对话生成等。

2024-07-10 12:09:22 940 1

原创 LLM大模型应用中的安全对齐的简单理解

在大模型应用中,安全对齐通常指的是确保模型的输出和行为与预期目标和社会规范相一致,不会产生有害或不当的结果。伦理和道德对齐:确保模型的输出不违反伦理和道德准则。法律和法规对齐:确保模型的行为符合相关法律和法规要求。用户意图对齐:确保模型的输出与用户的预期和需求一致,避免误导或错误的信息。社会价值对齐:确保模型的行为和输出符合社会普遍接受的价值观和标准。

2024-07-10 11:14:37 920 1

原创 基于智能座舱视觉DMS/OMS/RMS的简介

随着智能驾驶技术的迅猛发展,智能座舱逐渐成为汽车科技领域的热点话题。在智能座舱系统中,驾驶员监控系统(DMS)、乘员监控系统(OMS)以及舱室监控系统(RMS)是三大重要的子系统。本文将详细介绍DMS、OMS和RMS的发展历史,并探讨其在未来智能驾驶中的应用前景,结合当前法规要求和业界现状,提供真实可信的数据支持。本文回顾了智能座舱中DMS、OMS和RMS的发展历史,分析了其关键技术和未来发展趋势。

2024-07-09 13:09:49 757 1

原创 决策树算法简单介绍:原理和方案实施

决策树(Decision Tree)是一种常用的机器学习算法,它既可以用于分类任务,也可以用于回归任务。由于其直观性和解释性,决策树在数据分析和模型构建中得到了广泛的应用。本文将深入探讨决策树算法的原理、具体实现、优化方法以及实际应用。决策树算法以其直观性和解释性,成为机器学习领域中一种重要的分类和回归方法。通过特征选择、递归分裂和剪枝等步骤,可以构建出有效的决策树模型。本文介绍了决策树的基本原理,并通过库实现了一个简单的决策树分类器。同时,讨论了决策树算法的优化方法及其在实际中的应用。

2024-07-09 11:04:02 958

原创 掌握MM-LLM的必备知识:原理、实现与示例

MM-LMM,全称为Multi-Modal Large Language Model,是一种能够同时处理多种模态数据的大型语言模型。这种模型不仅可以处理文本,还能够理解和生成图像、语音等其他类型的数据。

2024-07-09 09:23:24 801

原创 超详细的 Linux 环境下 Anaconda 安装与使用教程

在数据科学和机器学习领域,Anaconda 是一个非常受欢迎的发行版,提供了许多常用的包和工具。本文将详细介绍如何在 Linux 系统上安装和配置 Anaconda 环境,并展示如何高效地使用它。Anaconda 是一个强大的工具,可以帮助我们更高效地进行数据科学和机器学习项目的开发与管理。希望本文能帮助你顺利安装和使用 Anaconda。在实践中不断探索和总结,会有更多的收获。

2024-07-08 15:14:40 588

原创 Linux - VIM 全面教程

VIM 是一个强大的文本编辑器,被广泛用于 Linux 系统上。对于许多程序员和系统管理员来说,熟练掌握 VIM 是一项非常重要的技能。本教程将全面介绍 VIM 的基础知识和高级功能,帮助你更好地利用这一工具。通过以上教程,相信你已经掌握了 VIM 的基本使用方法和一些高级功能。希望你能在日常工作中充分利用 VIM 提高效率。如果你有任何问题或建议,欢迎在评论区留言。

2024-07-08 15:08:18 354

原创 大语言模型系列-Transformer介绍

Transformer模型主要由编码器(Encoder)和解码器(Decoder)两个部分组成,每个部分又由多个相同的层(Layer)堆叠而成。每一层都包含两个子层:多头自注意力机制(Multi-Head Self-Attention Mechanism)和前馈神经网络(Feed-Forward Neural Network)。Transformer模型通过自注意力机制和多头注意力机制,有效地捕捉序列中不同位置之间的依赖关系,并通过位置编码引入位置信息。

2024-07-08 14:51:26 869

原创 安防一体机使用记录

选择U盘作为系统启动盘,实现请备份好U盘的文件,因为制作过程会将U盘格式化。4.发现依然无法ping通外网和局域网内其他服务,修改网卡配置文件,增加IP地址,网关等配置,如下图。5.选择完语言后进行下一步,点击安装位置,这里选择我们电脑自身的硬盘,不要选择错哦,还有一。6.这里选择的自动分区,最后会提示重装系统前的数据空间会被释放出来,跟着提示点击确定。4.关机,插入制作好的启动盘,开机可以看到如下界面,选择第一个进行安装。6.配置yum源,安装必备的软件,首先查询系统的版本。

2024-07-05 09:54:10 652

原创 VScode在linux下调试代码备忘

tasks.json文件用于更新代码,更新可执行文件,launch.json文件调用可执行文件options:为生成的makefile文件位置。该视频讲解了vscode在window下配置单个源文件/多个源文件/CMakeLists.txt工程,如何进行调试。总结:如果只配置launch.json文件,可以执行调试,当修改代码后,还是保持原来的代码进行调试;如果配置了tasks.json文件,当修改代码后,直接执行了make,再调试就是执行新的代码。3、tasks.json文件配置。

2024-07-05 09:22:43 375

原创 奥比中光astra_pro相机使用记录

环境下配置了opencv版本比较多,导致,字符串类型的数据乱码。a.用于快速查看相机是否安装正确;:但是执行时仍然出现运行不了等问题。b.可以可视化调整参数和显示效果。根据对应的型号找到需要的包工具。可以直接按照官方的开发手册安装。

2024-07-04 09:29:11 713

原创 相机标定浅谈

在图像测量过程以及机器视觉应用中,为确定空间物体表面某点的三维几何位置与其在图像中对应点之间的相互关系,必须建立相机成像的几何模型,这些几何模型参数就是相机参数。在大多数条件下这些参数必须通过实验与计算才能得到,这个求解参数的过程就称之为相机标定(或摄像机标定)。

2024-07-04 09:13:49 1309

原创 晶视 TPU-CV183x 开发板调研和测试验证

TPU:CPU:ROIPooling暂未发现能够自定义算子暂未发现 OP 级接口。

2024-07-03 09:30:54 821

原创 GITLAB配置CI教程

a、1和2使用刚才获取的URL和TOKENb、4表示TAG,设置好需要记住,比如你这个是x86_64_linux,后续在写ci脚本的时候TAG需要和这个对应;c、6表示的是默认运行ci的服务器地址,8.9这个可以使用个人账号或者公共账号都可;d、上述图片中没有标记数字的步骤,可以使用默认值直接enter;重复第三步的路径,查看有如下的内容,即配置成功。gitlab仓库有一些脚本的模板,可以自己选择,当然进一步学习高阶用法可以在网上找相关资料,或者从其他配置好的项目中去抄,最终目的就是为了创建一个。

2024-07-03 09:16:35 607

原创 LLM-Transformer:经典与前沿方法详解

大规模语言模型(LLM)是当前自然语言处理(NLP)领域的核心技术,而Transformer架构作为LLM的基础,极大地推动了这一领域的发展。本文将详细介绍LLM-Transformer的经典方法和最新进展,并提供相关论文的链接以便深入学习。

2024-07-02 12:11:07 972

原创 目标检测技术概述与最新进展

目标检测技术在过去的几十年里取得了长足的进步,从传统的滑动窗口和HOG-SVM方法,到深度学习时代的R-CNN和YOLO系列,再到如今的Transformers和自监督学习方法。每一次技术革新都带来了检测精度和速度的提升。相信在不久的将来,随着计算机视觉技术的不断发展,目标检测将会在更多实际应用中发挥更大的作用。希望本文能够帮助读者了解目标检测的经典方法和最新进展。如果您对这些方法感兴趣,可以阅读相关的论文,深入了解其原理和实现细节。

2024-07-02 11:51:16 766

原创 互联网场景下人脸服务基线方案总结

1.1序号术语或缩略语说明性定义12345671.4从人脸服务基线的测试结果中,可以看出,在当前的测试标准下,人脸服务的效果不理想,最大的召回率和准确率都比较低,其中的问题有的是出现在测试标准中所以需要对测试的指标重新进行制定,也有的问题是出现在服务,所以需要对人脸服务引擎本身进一步的优化。

2024-07-01 14:40:08 874

原创 互联网场景下人脸服务解决方案优化设计

1.1序号术语或缩略语说明性定义12345671.4。

2024-07-01 14:25:41 1060

原创 深入理解LibTorch:从安装到API详解

本文全面介绍了LibTorch的安装方法和关键API的使用,旨在为深度学习领域的开发者提供一份详实的指南,助力他们更高效地利用LibTorch进行模型开发与部署。无论是初学者还是有经验的开发者,都可以从中获得有价值的信息和实用的技巧。

2024-06-29 15:03:46 693

原创 valgrind使用浅谈

Valgrind是一款用于内存调试、内存泄漏检测以及性能分析的软件开发工具,它可在以下平台上运行: X86/Linux、AMD64/Linux、ARM/Linux、ARM64/Linux、PPC32/Linux、PPC64/Linux、PPC64LE/Linu x、S390X/Linux、MIPS32/Linux、MIPS64/Linux、X86/Solaris , AMD64/Solaris, ARM/Android (2.3.x 及 更 高 版 本 ), ARM64/Android, X86/And

2024-06-29 09:34:47 681

原创 基于高通8155的SNPE-PTQ量化方法介绍

若尚未执行量化,执行上步命令时终端将输出黄色警告信息提示,则前往量化服务器的。效果测试原理:snpe-net-run分别推理浮点模型、量化模型,计算。脚本化执行量化步骤和分步手动执行效果相同,但大大简化了步骤。若尚未执行量化,执行上步命令时终端将输出黄色警告信息提示,则切换到。登录(远程桌面的系统空间不足,已无法创建新用户),连接进入后通常在。资源,命令完成后需再执行下面两步;资源,命令完成后需再执行下面三步;下的文件夹名称,需保持对应,不可随意修改。已完成脚本编写,只需按步骤执行脚本即可。

2024-06-28 14:01:28 1022

原创 联发科MT8666-NNAPI移植

(4) 编译部署:build_android.bat → delivery.bat。(1) target部署至/data/local/tmp/bin下。(3) 需要先运行Carcorder APK,再运行DMS APK。(5)摄像头无法获取图像而导致卡住的问题已提相关同事处理。(3) 拷贝npu版本库里的模型及库文件至工程。原因:domain位置不对,需要更新模型。不用创建,网络的输入输出节点需要创建。(1) 只需要视觉DMS,其他不需要。(2) 车机需要联网(引擎需要权限)改变输入的类型,详情参见。

2024-06-28 12:06:29 1070

原创 安霸CVFlow推理开发笔记

如果发现串口连接不上,大概率是别人在用,可以用别人的账号登一下 看谁在用,总共就这几个账号。存在则安装成功,反之失败。2.toolchain安装时,安装使用如下脚本ubuntuToolChain,不要用installToolChainONLY,同时提前配置好pip源。,留意不要选错登到广汽的8155车机上 广汽8155车机的串口操作失误 比如敲一个exit就蓝屏了,留意不要串口登到广汽8155上面去。7.编译CV code,生成可以在CV2x上运行的程序,生成模型文件face_align.bin。

2024-06-27 11:54:34 817

原创 YouCompleteMe插件安装方法简述

YouCompleteMe是VIM中进行C/C++ 开发的重要工具,可以极大提升linux下C/C++开发效率。YCM需要高版本的gcc (8.0以上版本,支持C++17) 和 vim(8.0以上,支持python3.6以上)二、编译gcc_8.31. 获取源码wget-P ~2. 运行 download_prerequisites 脚本3. 创建编译目录4. 配置。

2024-06-27 11:36:40 966

原创 Centos7到Centos6的移植踩坑

综上所述:第二种方法最不稳定,第三种方法稳定性待评估,推荐使用第一方法,就是比较麻烦点,要把所有的依赖库重新编译下!

2024-06-26 10:57:49 902

原创 台式机通过网线直连笔记本,台式机通过笔记本上网【解决台式机没有网络的问题】

已剪辑自:①笔记本有个,连接了wifi,可以上网。②台式机只有有线网卡,通过网线和笔记本的有线网卡相连。

2024-06-26 10:51:18 451

原创 Android-SimplePerf工具浅解

通过传入选项,我们可以选择到哪里寻找被监视的程序使用的 perf.data 和 可执行二进制文件,过滤不感兴趣的记录,并决定如何分组记录。默认情况下,路径是记录时被监视的进程使用的可执行二进制文件,然而,在生成报告时这些二进制文件可能不存在,或不包含符号表和调试信息。当运行 stat 命令时,如果硬件事件的数量大于 PMU中可用的硬件计数器的数量,则内核在事件间共享硬件计数器,因此每个事件只在总时间中的一部分内被监视。每个子命令支持不同的选项。在上面的例子中,每个事件被监视的时间大概占总时间的 87%。

2024-06-25 09:44:49 745

原创 使用自己的Win10/11笔记本进行linux开发-WSL配置使用

直接进去访问存在的几个问题:(1)麻烦,路径太长;(2)编辑文件会改变的文件的权限,你想在linux系统中编辑的话,需要重新chmod授权,还是麻烦。P.S.:下载后不要用管理员权限安装,不然模型启动的root的权限的子系统。(2)映射到一个网络硬盘中,可以像访问硬盘一样访问linux子系统。直接在子系统Ubuntu里安装,执行code . 即可。进入Ubuntu的目录,然后保存为快捷访问就可以;出现“参考的对象类型不支持尝试的操作”的解决方法。(1)在资源管理器的路径里,直接输入。D、安装vscode。

2024-06-25 09:27:32 386

原创 关于CPU性能分析的潜解

所以我们在编译测试程序的时候,如果指定编译器的优化等级的话,我们会发现在不同的优化登记下,表现出来的性能指标会有差别,优化等级越高,性能指标越好,以下是一款芯片在不同的优化登记下的指标参数。所以,除非必须,我们没有必要显式的去进程绑核操作。MIPS/MHz : 表示 CPU 在每 1MHz 的运行速度下可以执行多少个MIPS ,如 10MIPS/MHz,表示如果 CPU 运行在 1MHz 的频率下,每秒可执行一千万条指令,如果 CPU 运行在 5MHz 的频率下,每秒可执行五千万条指令。

2024-06-24 11:17:14 934

原创 GIT-LFS使用

git lfs pull --include="output/data/smoke/iFPPTL/**" #下载output/data/smoke/iFPPTL下所有文件。git lfs track "${data_dir}/**" #追踪${data_dir}下所有文件(双引号不可省略)目前git仓库有很多很大的文件需要管理,但是直接上传,每次clone的文件太大,所有准备使用git-lfs解决。git lfs install --skip-smudge #clone时跳过lfs文件下载。

2024-06-24 10:37:06 430

原创 Mxnet转Onnx 踩坑记录

使用将MXNET模型转换为ONNX的过程中有很多算子不兼容,在此对那些不兼容的算子替换。

2024-06-23 11:33:00 1140

原创 基于模型蒸馏的模型加速方案总结

1.1序号术语或缩略语说明性定义12345671.4在经过三个数据集上对模型蒸馏(知识提取)的方法进行实验,都表明模型蒸馏方法的有效性。当原始模型精度很高的时候,模型蒸馏的效果往往都会很好,并且在特定的模型T和lamda超参数的组合下,小的student model可以很好的学习到大的teacher model,甚至会超过原始大的网络的精度。

2024-06-23 11:18:21 1315

原创 基于模型蒸馏的模型加速方案实验设计

1.1序号术语或缩略语说明性定义12341.4。

2024-06-23 11:09:31 650

原创 基于int8量化技术的模型加速方案总结

1.1序号术语或缩略语说明性定义12345671.4OCR模型之所以可以给出CPU上使用INT8矩阵乘法要比FLOAT32矩阵乘法要快3倍多的效果的原因是,他们组的FLOAT32矩阵乘法baseline的速度就比较慢,对比的对像是用SSE指令集自己实现的FLOAT32和INT8矩阵乘法的对比,对于我们要替换caffe中的MKL矩阵乘法库的需求来说没有参考意义,在我们的实验中也确实可以复现OCR组的实验结果,但是在和MKL库FLOAT32矩阵乘法对比的实验中INT8本身优势已经荡然无存了。

2024-06-22 11:09:12 741

原创 基于INT8量化技术方案的模型压缩实验设计

1.1序号术语或缩略语说明性定义12341.4。

2024-06-22 10:55:24 953

原创 基于稀疏矩阵方法的剪枝压缩模型方案总结

1.1序号术语或缩略语说明性定义12345671.4通过一系列的实验和结果分析,可以看出剪枝策略可以很好解决模型尺寸压缩的问题,特别是如果允许模型精度有些许下降的前提下,模型的压缩率可以达到0.9,然而要是同时还想达到模型前向加速的效果,目前使用的基于稀疏矩阵和稠密矩阵的乘法的加速方法是无效的,但是稀疏矩阵乘以向量的方法是可以尝试的。

2024-06-20 10:22:43 769

Deep Learning中文版本

Deep Learning中文版本,Yoshua Bengio 新书《Deep Learning》中文版发布。该书由北京大学张志华老师团队负责翻译。本书于学习研究目的,不得用于任何商业行为。

2017-10-09

和单片机有关的四十个实验

单片机的40个实验,适于初学者可以自己学习设计电路,内容比较丰富

2010-10-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除