陈洪伟-CSDN博客

这类结构的模型适用于需要生成序列的任务，可以从输入的编码中生成相应的序列。这类结构的代表也就是我们平时非常熟悉的GPT模型的结构，所有该家族的网络结构都是基于Decoder-Only的形式来逐步演化。既包含编码器也包含解码器，先理解输入的信息（Encoder部分），然后基于这个理解生成新的、相关的内容（Decoder部分），通常用于序列到序列（Seq2Seq）任务，如。模型在时间线上的位置表示它们的发布日期。仅包含编码器部分，主要适用于不需要生成序列的任务，只需要对输入进行编码和处理的单向任务场景，如。

2024-04-18 11:23:09 1540

原创 GPT状态和原理 - 解密OpenAI模型训练

基础模型有很多熵。

2024-04-17 15:57:42 1252 1

原创 Transformer的Decoder的输入输出都是什么

decoder input: Encoder input(我有一只猫) + start [---I have a cat /end--- masked]decoder input: Encoder input(我有一只猫) + start I [---have a cat /end--- masked]训练时，decoder的并行计算是指翻译第i+1个单词无需等待第i个单词的输出，因为训练时知道所有训练数输入数据的真实标签值，无需等待，可并行运算。/结束符，方便预测第一个Token/结束预测过程。

2024-04-16 18:16:26 1584

原创 GPT中的Transformer架构以及Transformer 中的注意力机制

看了两个比较好的视频，简单做了下笔记。

2024-04-11 15:33:04 1600

原创 SOPHON算能服务器SDK环境配置和相关库安装

于是我直接在google搜索：dkms.noarch 0:3.0.12-1.el7.rpm下载，找到如下网页。后面安装的libsophon以及sophon-mw都在SDK大包里面。在下载的SDK大包中找到下面的内容，然后拷贝到算能服务器中。其中在安装dkms的时候提示下面的错误。在前面下载的SDK大包中找到如下内容，然后把其中的四个拷贝到算能服务器上。然后使用下面的命令安装。然后使用下面的命令安装。

2024-03-19 14:21:31 577

原创 GCC的符号可见性: 解决Linux多个库同名符号冲突问题以及引用不同版本库的问题

某项目中因为使用到了不同版本库的问题，因此整理下GCC的符号可见性问题，方便自己以后再次使用。

2024-02-26 11:12:17 1264

原创 vscode远程调试服务器的Python代码

这篇博客首先参考了我自己之前的两篇博客。

2024-02-23 11:32:29 750

原创 SOPHGO算能科技新版SDK环境配置以及C++ demo使用过程

推荐使用cmake中的find_package查找libsophon和sophon-mw的库包，并链接到自己的程序中。部分头文件不包含于libsophon，如bm_wrapper.hpp、utils.hpp。SoC模式下，原来/system下的软件库包，现位于/opt/sophon/下。SoC模式下，通过开机时的systemd服务，自动加载/opt/sophon/libsophon-current/data下的ko内核模块。如用户定义的自启动服务，并且依赖BM168X，请确保在ko加载后启动。

2024-02-20 16:16:04 1952

原创 yolov5导出onnx模型问题

我改完之后，输出变成x y w h box_score idxs label1_confidence label2_confidence .... labeln_confidence.原来的yolov5输出是x y w h box_score label1_confidence label2_confidence .... labeln_confidence.为了适配C++工程代码，我在导出onnx模型时，会把models/yolo.py里面的forward函数改成下面这样，

2024-01-31 17:55:08 1189

原创利用tpu-mlir工具将深度学习算法模型转成算能科技平台.bmodel模型的方法步骤

上图就是tpu-mlir的整体架构图，主要分两步, 一是通过将原始模型转换成mlir文件, 二是通过将mlir文件转换成bmodel/cvimodel。如果要转INT8模型, 则需要调用生成校准表, 然后传给。如果INT8模型不满足精度需要, 可以调用生成量化表, 用来决定哪些层采用浮点计算，然后传给生成混精度模型。

2024-01-24 16:31:52 1877 4

原创程序员的周末——硬件设计中的Hello World__STM32核心板绘制

周末有时间，用Altium Designer 20绘制一个STM32核心板电路，走一遍原理图设计、原器件布局、布线、覆铜、电气规则检测等大体流程，下面简单记录下过程。

2024-01-19 16:35:03 1201

原创基于EasyDarwin、ffmpeg实现rtsp推流

某项目中测试时需要用到推流，于是用EasyDarwin、ffmpeg实现了RTSP推流，简单记录下过程，

2023-12-20 15:53:22 1026

原创 error while loading shared libraries: libva.so.1: cannot open shared object file: No such file or di

然后问bing ai说要从github下载源码然后配置编译安装，太麻烦了，但是其实自己电脑中是有这个库的，只不过软连接的名字不一样，解决方法如下。这里可以看到自己电脑中是把 libva.so.2.100.0链接为libva.so.2，所以，那我再软连接个libva.so.1就行了，在做某项目的时候遇到这个问题，

2023-12-20 14:42:08 765

原创将Linux中的screen命令封装成class类并使用它在代码中执行相应命令

可以用screen -ls查看所有会话，比如。

2023-12-08 14:49:03 506

原创父子进程继承问题：OSError: [Errno 88] Socket operation on non-socket错误记录

基本上没有什么有用信息，于是我想那我就去Python的flask库源码里面看看，然后我在flask库源码里面添加了打印，至于在哪些代码添加打印，从报错可以看到代码执行顺序，所以按照报错信息提示的代码执行流程去添加打印。这里很明显有个问题，就是我传进去的port是10000，然后第一次打印确实是10000，但是第二次打印为什么变成0了，于是去找第二行打印那里的代码。修改完之后再次执行程序，现在发现两行打印的端口号是统一的了，第二行打印不再是0了，程序也不再报错了，问题解决。然后我运行程序，发现打印内容如下。

2023-12-06 13:58:24 1188

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

君正T41芯片交叉编译工具链

华为ascend平台模型转换工具和脚本

activeMQ收发工具.rar

105套个人工作总结汇报PPT模板，

个人工作总结汇报PPT模板

yuvviewer,yuv播放器

PCA特征值压缩原理.docx

HI3536交叉编译工具链.txt

ndjpnladcallmjemlbaebfadecfhkepb.zip

2020-07-24-21-20-52-download-P3X-OneNote-2020.10.105.AppImage

pytorch学习视频百度网盘链接.txt

HI3559a的各种资料百度网盘链接.txt

httpclient.zip

SDC APP开发指南.pdf

HiSVP API 参考.pdf

ucos2官方资料

空空如也