andeyeluguo
这个作者很懒,什么都没留下…
展开
-
【CUDA】CUDA非root用户安装
CUDA非root用户安装,不影响root用户,设置不影响一块登录该账号的人。需要弄到~/.bashrc中生效后者命令行一句句执行,cuda非root用户安装。写到shell脚本里不生效。原创 2024-08-07 14:34:38 · 112 阅读 · 0 评论 -
【FPGA】quartus ii如何将verilog代码转成电路图
编译通过。原创 2024-08-06 21:43:07 · 129 阅读 · 0 评论 -
【FPGA】verilog加法器代码
主要加了写CLCOK和reset信号。原创 2024-08-06 21:01:02 · 39 阅读 · 0 评论 -
【FPGA】乘法器的verilog代码
包括了基本的顶点乘法器,和利用乘法器实现的平方,三次方。原创 2024-08-06 20:46:50 · 43 阅读 · 0 评论 -
【FPGA】wire和reg的区别
在 Verilog 中,`wire` 和 `reg` 是两种不同的数据类型,用于表示信号或变量。在 Verilog 中,正确选择 `wire` 和 `reg` 类型很重要,以确保正确地描述电路的组合逻辑和时序逻辑部分。- `reg` 用于表示寄存器或存储器元素,通常在时序逻辑块中使用,可以在时序逻辑块中赋值以保留状态。- `reg` 类型通常用于时序逻辑块(如 `always` 块)内部,表示寄存器或存储器元素。- `wire` 用于连接组合逻辑中的信号,表示连线传输,不能在时序逻辑块中赋值。原创 2024-07-25 20:19:52 · 178 阅读 · 0 评论 -
【FPGA】定点数的理解
左移一位变成了00abcd0000.,十进制数为y = a*2^7 + b* 2^6 + c*2^5 + d* 2^4 = 2*x。比如000abcd000 这个二进制表示的数,十进制数为x = a*2^6 + b* 2^5 + c*2^4 + d* 2^3。移位的时候可能会把1移出去的现象,补1能够避免精度的丢失。定点数是固定小数点的数,浮点数是浮动小数点的数。即左移相当于乘以2,同理右移相当于除以2。负数的反码是除符号位的位取反。负数的补码是反码补上1。原创 2024-07-31 09:05:12 · 68 阅读 · 0 评论 -
【FPGA】modelsim编译verilog代码产生错误集合
可能是一些变量不能放在一些begin和end中,改下assign的位置。原创 2024-08-05 22:43:01 · 59 阅读 · 0 评论 -
【FPGA】module中CLOCK RESET iCall oDone的含义
一般的module并不只有iData和oData,还有其他的控制信号,如CLOCK RESET iCall oDone。原创 2024-08-05 22:20:58 · 1301 阅读 · 0 评论 -
【C++】【常见面试题】虚函数
为什么翻译成虚函数?因为这个函数虽然在那里,但用户实际调用的时候,就可能调用的不是它而是他的子类的函数,就好象不存在似的经典多态使用代码#include <iostream>#include <vector>using namespace std;class Layer {public: virtual void run() { std::cout << "layer" <<std::endl; };};原创 2021-01-28 09:24:29 · 101 阅读 · 0 评论 -
【深度学习】【框架】【基本结构】激活函数
优点: 它既有 ReLU(Rectified Linear Unit)激活函数的一些优点(例如,能够缓解梯度消失问题),又能解决 ReLU 函数的一些缺点(例如,ReLU 函数不是零中心的,且在负数部分的梯度为零)。此外,Swish 函数还是平滑函数,这意味着它在整个定义域内都有导数,这有利于优化。函数:f(x) = x * sigmoid(x)原创 2024-08-03 18:08:38 · 160 阅读 · 0 评论 -
【KAN】hello, kan
初始化+数据集-》训练-》剪枝-》训练-》符号-》训练-》公式。画图,画刚开始初始化的kan网络。自动或者手动设置激活函数为某符号。总结:所以训练的步骤很复杂。画训练后的kan网络。原创 2024-08-03 08:31:43 · 146 阅读 · 0 评论 -
【KAN】【API教程】plot
控制激活函数的透明度,越大越多激活函数显示,通常设置一个函数的值,这样只有重要的连接显示。如果某个激活函数设置符号,则会变成红色。初始化KAN和创建数据集。剪枝,移除不重要的节点。画图初始化后的KAN。原创 2024-08-03 10:01:15 · 109 阅读 · 0 评论 -
【KAN】【API教程】get_fun
抽取某个激活函数的样子。原创 2024-08-03 10:21:52 · 67 阅读 · 0 评论 -
【KAN】【API教程】checkpoint
玩kan和玩电脑游戏一样好玩,用checkpoint相当于存档,做错了事情可以恢复。原创 2024-08-03 10:44:53 · 60 阅读 · 0 评论 -
【深度学习】【框架】【基本结构】transformer
论文地址:1. 整体结构2. 内部结构3. 公式。原创 2024-08-01 11:20:57 · 164 阅读 · 0 评论 -
【KAN】【API教程】索引
每个激活函数都被(层的索引号,输入神经元索引号,输出索引号)确定。简单来说就是确定激活函数的坐标。边或者激活函数的索引。原创 2024-08-03 09:40:47 · 54 阅读 · 0 评论 -
【机器视觉】【目标检测】【面试】独家问题总结表格
anchor free是对gt实际的左上和右下的点做回归,anchor box是对辅助框即锚框做回归。锚框是辅助框, 可以通过预设的长宽比设定,也可以通过k-means算法聚类数据集得到。非极大值抑制是对置信度不是极大值的预测框抑制去掉,极大值的保留。结构有着更多的残差连接,所以其有着更丰富的梯度流。分别由两个并行卷积得出而不是直接由一个卷积。增强操作,可以有效地提升精度。由两路卷积并行得出类别和位置的。1. 训练的时候数据集旋转。介绍下yolov8的创新点。的训练方式,在最后的。中解耦头的意思是什么。原创 2024-08-02 22:09:27 · 269 阅读 · 0 评论 -
【大模型】【面试】各种问题
ALiBi (Attention with Linear Biases) 的偏置矩阵是什么?如何解决 PPO 的训练过程同时存在4个模型(2训练,2推理),对计算资源的要求较高 问题?LangChain 中 Prompt Templates and Values 是什么?指示微调(Prompt-tuning)与 Prefix-tuning 区别 是什么?指示微调(Prompt-tuning)与 fine-tuning 区别 是什么?模型如何判断回答的知识是训练过的已知的知识,怎么训练这种能力?原创 2024-08-02 22:06:10 · 26 阅读 · 0 评论 -
【大模型】【面试】独家总结表格
这些模型在大量文本数据上进行了预训练,使它们能够学习数据中的模式和关系,然后可以进行特定的NLP任务的微调。在大型语言模型中的使用已经在各种NLP任务的性能上实现了显著的改进,并使从业者更容易将最先进的NLP模型集成到他们的项目中。然而,由于模型已经在大量文本数据上进行了预训练,它已经对语言有很强的理解,可以更快地学习任务特定的特征,而不需要从零开始训练模型。在这种情况下,微调过程涉及使用特定任务的标记示例的小型数据集来训练模型,通过更新模型参数来改善模型在任务上的性能。原创 2024-08-02 22:03:50 · 157 阅读 · 0 评论 -
【大模型】【RAG】langchain实战
参考资料:大模型应用框架LangChain系统教程3 - 检索外部数据_哔哩哔哩_bilibili原创 2024-08-02 20:20:13 · 37 阅读 · 0 评论 -
【大模型】【RAG】mivus快速开始hello world 实战
下面可以运行milvus-lite版本作为简单的学习。可以看到检索的结果很差劲。后面结合langchain看一下。原创 2024-08-02 10:08:20 · 162 阅读 · 0 评论 -
【大模型】【RAG】导论
此为RAG的基本知识。原创 2024-08-01 21:05:40 · 42 阅读 · 0 评论 -
【大模型】【RAG】langchain和minus的实战例子
参考。原创 2024-08-01 21:08:18 · 97 阅读 · 0 评论 -
【常用库】【pytorch】基本部件
1. 卷积2. batchnorm加减乘除。原创 2024-08-01 15:31:05 · 60 阅读 · 0 评论 -
【大模型框架】【推理加速】PagedAttention
PagedAttention模仿的是操作系统里面的虚拟内存(virtual memory)和分页(page)技术,系统往往使用KV cache作为一种加速手段,但是占用的显存就比较大,并且KV cache占用的显存是动态收缩的,可能浪费显存。能实现KV cache接近零的显存浪费。原创 2024-08-01 10:49:07 · 48 阅读 · 0 评论 -
【大模型框架】【推理加速】KV CACHE
这里abc的运算中间值Q V可以保存下来作为Cache,避免后面继续再算了。transformer是自回归生成模型,abc三个字符预测def。d进行回归得到abc,回归讲究的是回去,如香港回归。核心思想是空间换时间来进行加速。原创 2024-08-01 10:01:10 · 57 阅读 · 0 评论 -
【ASR系列】【论文阅读】SEACO-PARAFORMER
language model 语言模型 关注语言(linguistic)信息。hotword customization 热词定制 定制一些人名、实体等。acoustic model 声学模型 关注语音(phonetic)信息。任务是热词定制,效果很好。原创 2024-07-31 13:40:43 · 59 阅读 · 0 评论 -
【ASR系列】【论文阅读】CIF
WER(word error rate): 单词错误率,是评价asr系统的一种重要指标,越低越好。是Continuous integrate-and-fire的简称,连续积分和发射,暂时看不懂。原创 2024-07-31 14:16:23 · 144 阅读 · 0 评论 -
SNN系列论文阅读:梦开始的地方
一开始论文将nn分为三类。原创 2024-07-31 15:34:59 · 46 阅读 · 0 评论 -
PySceneDetect用于场景变换检测切割视频
这样就生成了很多视频clip,并且每个clip有三张图片,分别为开始中间和结束的图片。原创 2024-07-24 10:24:57 · 49 阅读 · 0 评论 -
专利相关笔记
要下载专利,百度文库或者其他地方都要钱,其实这些都不需要钱的,地址。这个是国家知识产权局办的。原创 2024-07-30 20:46:42 · 39 阅读 · 0 评论 -
右键没有压缩选项
选择选项-》设置,添加到winrar到开始菜单即可。想压缩文件选中右键没有压缩选项。原创 2024-07-30 21:13:28 · 76 阅读 · 0 评论 -
GraphRAG阅读笔记
比如“这个数据集的主题是什么?一种方案是把整个数据集送入模型,那太大了。我寻思把多个搜索的结果放到RAG中就行呗。Element instances 元素实体,包括node(节点,或称entity),edge(边,或者称关系)Community summaries 社区发现,把某些节点看成一个社区,一个村落。普通(naive)RAG无法在涉及到全局或者多个页面的问题上得到很好的结果。Text chunks 把文档切分成几块。对graphrag的论文进行阅读。原创 2024-07-30 15:09:15 · 197 阅读 · 0 评论 -
【计算机组成原理】人类社会与计算机
用人类的一些实例来理解计算机的概念,涉及到的技术包括计算机组成原理和操作系统,适合小白查看,后面根据自己的理解来更新。操作系统是销售员,内存是店面,顾客看到可以买的,外存是仓库,空间大,容量大,销售员可以根据店面的容量大小,从外面和里面交换货物。cpu自带的寄存器,内部存储,在酷睿三芯片,里面有cpu和cache,cpu先访问cache,然后访问内存条。固定大小的一段连续的存储是一个页面,可以想象为一页非常长的纸切割成一本书,一张纸是一个页面。人类的纸张太长不好存储,就采用分页的分成好几页的形式来处理。原创 2024-07-30 14:22:11 · 31 阅读 · 0 评论 -
vllm部署的一些思考
事实上,生产中的分布式推理,是 用k8s等进行管理,每个模型在一个容器中而已,如一个7b的模型占用一个GPU,作为一个node,而不是把模型分布式,是把服务分布式。但是这种方式只是把非常大的模型如lamma 3.1 ,这个模型有405b,需要用多机多卡的方式进行分布式。vllm号称利用ray支持多机多卡的方式,链接如下。常用的有xinference,还有各种k8s的集成。原创 2024-07-30 10:37:36 · 47 阅读 · 0 评论 -
vllm部署记录
pip install -e`是Python包管理器`pip`的一个参数。在这里,`-e`代表editable,意思是在安装包时,它会以可编辑模式进行安装。这样安装的包实际上是通过符号链接与源代码关联起来的,这意味着您对源代码的修改会立即反映在安装的包上,而无需重新安装。第一个opt-125m是名字,可以在vllm支持的模型中查到,第二个是模型存放文件夹及其路径。注意在modelscope上的这个opt-125m好像不行了,我git不下来报错。2. 源码部署普通单机(失败)原创 2024-07-26 17:10:53 · 190 阅读 · 0 评论 -
AttributeError: module ‘pkgutil‘ has no attribute ‘ImpImporter‘. Did you mean: ‘zipimporter‘?
scikit_learn==1.1.3为某个版本的时候出错,把版本号去掉就行了,anaconda自带了。用最新的anaconda安装numpy== 某个版本或者。原创 2024-07-22 21:29:24 · 79 阅读 · 0 评论 -
pandoc转换md到pdf遇到的问题
2.pdflatex安装失败,只能安装wkhtmltopdf。1. pandoc必须要用sudo才能运行这是我没有想到的。原创 2024-07-25 20:20:50 · 141 阅读 · 0 评论 -
newton算法实现的div的verilog
【代码】newton算法实现的div的verilog。原创 2024-07-21 16:56:01 · 196 阅读 · 0 评论 -
基于cordic的arcsin的代码理解
根据 sigma 的值,更新 x、y 和 deg 的值,并在每个阶段更新 i 和 k 的值。最后,使用 assign 语句将输出变量与内部变量进行关联,计算 arcsin 和 arccos 的值,并将 deg、y 和 x 的值分配给 q_deg、q_y 和 q_x。x 被设置为 2^16,y 被设置为 0,deg 被设置为 0,k 被设置为 0,gamma 被设置为输入变量 iData 的值。需要注意的是,代码中的 atan 数组是 Cordic 算法中的固定值,用于计算反正弦和反余弦的近似值。原创 2024-07-21 16:37:43 · 278 阅读 · 0 评论