heisenberg.liu-CSDN博客

原创 hls4ml 从github源码安装

https://blog.csdn.net/weixin_39950057/article/details/110273007git clone完事儿之后，激活conda环境，python setup.py install

2022-06-28 23:19:39 496 1

原创 Ubuntu18.04安装hls4ml+tensorflow-gpu

主要分为两部分，一部分是安装hls4ml另一个是安装gpu 版本的tensorflow，比较难安装的是tfhttps://github.com/fastmachinelearning/hls4ml-tutorial不然报错”AttributeError: module ‘tensorflow.keras.layers’ has no attribute ‘MultiHeadAttention’根据https://github.com/fastmachinelearning/hls4ml/issues/514

2022-06-25 20:34:05 2610

原创 tensorflow报错Could not load dynamic library ‘libcudnn.so.8

https://github.com/tensorflow/tensorflow/issues/45200输入

2022-06-22 16:30:06 179

原创 HLS4ML报错The board_part definition was not found for tul.com.tw:pynq-z2:part0:1.0.

运行HLS4ML tutorial 7报错这个是复制的别人的报错，我报错的是pynq-z2解决方案然后查看board.repoPaths,输入验证一下这个路径包含文件4. 然后在回去运行

2022-06-19 00:29:19 1584 1

原创 HLS4ML/vivado HLS 报错解决方案

报错内容原因是因为GCC文件冲突，这里用的是vivado2019.2解决方案：在每个源文件（main.cpp和test.cpp）头顶添加下面语句参考：

2022-06-15 16:47:53 1941

原创 HLS4ML进入方法

000

2022-06-14 19:56:07 1030

原创 Dynamic-OFA: Runtime DNN Architecture Switching for Performance Scaling on Heterogeneous Embedd Pla

CSDN太难用了。。。以后将转战知乎。。。文献阅读：Dynamic-OFA: Runtime DNN Architecture Switching for Performance Scaling on Heterogeneous Embedded Platforms本文用LUT做的run-time management, 就是在offline中先用accuracy predictor和latency predictor去预测sub-network延迟和acc，然后存在LUT里，在runtime的时候o

2022-05-17 03:40:39 171

原创 vncserver +tigervnc 黑屏解决方案

https://askubuntu.com/questions/1208482/vnc-remote-desktop-screen-is-black用vncserver登录服务器，一直黑屏解决方案：我的服务器账号登录之后默认是conda的base模式,需要先退出baseconda deactivate再运行vncserver -geometry 1920x1080再在tigervnc上正常登录......

2022-05-16 15:15:12 3041

原创【pytorch】Could not load dynamic library ‘libcudart.so.11.0‘；

Could not load dynamic library 'libcudart.so.11.0';我用的conda环境，在/home/anaconda3/envs/环境名字/lib文件夹下面能找到libcudart.so.11.0 文件，但是import 的时候显示2022-04-25 10:19:13.667333: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic lib

2022-04-25 16:43:03 1384

原创 R9000p搜不到wifi

1.长按关机，重启2.协议改为ac

2022-03-12 18:27:20 914

转载 SSH免密登录

转载自 https://blog.csdn.net/jeikerxiao/article/details/84105529SSH 三步解决免密登录1.客户端生成公私钥2.上传公钥到服务器3.测试免密登录1.客户端生成公私钥本地客户端生成公私钥：（一路回车默认即可）ssh-keygen上面这个命令会在用户目录.ssh文件夹下创建公私钥```bashcd ~/.sshls下创建两个密钥：id_rsa （私钥）id_rsa.pub (公钥)# 2.上传公钥到服务器这里测

2022-03-09 14:51:48 113

原创【文献阅读】ShEF: Shielded Enclaves for Cloud FPGAs

吐了，好tm难懂问题：secure the FPGA-based accelerator存在问题：现有加密算法计算复杂，依赖CPU的library，不同应用的安全需求不同，CPU的TEE不能直接在FPGA运行。现有FPGA加速器现有用于accelerator TEE存在问题：不能防御direct physical attacks, require fundamental hardware changes, address isolated challenges, rely on external

2022-03-04 22:12:00 267

原创如何链接实验室服务器

实验室服务器1.ssh username@kw61087.kaust.edu.sa （kw61159 vitis)2.vncserver -geometry 1920x1080 (打开图形界面)3.tigervnc激活环境服务器输入1.conda activate cs323n2.jupyter notebook --no-browser --port=8889本机终端输入3.ssh -N -f -L localhost:8888:localhost:8889 username@kw610

2022-03-01 19:06:05 33905

原创远程访问服务器Jupyter Notebook的两种方法

转载：https://www.jianshu.com/p/8fc3cd032d3c方法1. ssh远程使用jupyter notebook在远程服务器上，启动jupyter notebooks服务：jupyter notebook --no-browser --port=8889在本地终端中启动SSH：ssh -N -f -L localhost:8888:localhost:8889 username@serverIP其中： -N 告诉SSH没有命令要被远程执行； -f 告诉SSH在后台执

2022-02-26 22:17:28 7105

原创【文献阅读】Cross-VM Information Leaks in FPGA-Accelerated Cloud Environments

摘要：对FPGA和相关资源的low-level access像PCIe, SSD, DRAM等容易收到恶意攻击，本文提出了一个新的快速PCIe-contention-based channel，实现不同FPGA加速虚拟机上转移数据。该PCIe receiver circuit能够不同虚拟机之间泄露信息：收到covert transmission（隐蔽传输），细粒度监控PCIe bus，从通过其他人PCIe traffic signature检测从其他人的FPGA加速虚拟机的不同种类的活动。还能长期监

2022-02-26 03:11:59 158

原创【文献阅读】Remote Power Attacks on the Versatile Tensor Accelerator in Multi-Tenant FPGAs

在FPGA上实现基于功耗的侧信道攻击，实现得到multi-tenant上victim的模型信息。现有针对FPGA远程攻击方案较少，现有方案需要物理接触的限制。实现在multi-tenant fpga上实现了对VTA进行攻击，通过TDC检测VTA执行能量消耗，逆向工程得到在VTA上执行模型的结构和层的类型。创新点是不需要物理接触、不需要监控bus和memory，不需要提前知道模型细节。之前提出的攻击方案没有考虑到VTA利用TLPP并行执行多条指令。难点在于VTA使用statically-schedul

2022-02-25 19:32:07 499

原创【文献阅读】Fingerprinting Cloud FPGA Infrastructures

开源：https://caslab.csl.yale.edu/code/cloud-fpga-fingerprinting摘要：问题：攻击者不需要攻击和损害FPGA云，能够了解什么。探索FPGA特点能够被利用初始化PUF用于识别不同的FPGA板子。通过从FPGA DRAM中提取FPGA PUF指纹识别FPGA云。现有攻击FPGA云的方法Multi-tenant和temporal convert communication攻击基于能够确定与被攻击者使用相同的板子的假设，本文通过Dacay-based P

2022-02-25 01:31:51 271

原创【文献阅读未遂】Understanding data storage and ingestion for large-scale deep recommendation model training

Understanding data storage and ingestion for large-scale deep recommendation model training不咋好读，不太懂摘要问题：Domain-specific accelerator特定领域加速器合并进数据中心尺度的集群，增加大数据集的训练的有效性和吞吐量，data storage and ingestion pipeline (DSI) 和用于存储和预处理训练数据的系统和硬件限制训练能力。DSI系统需要创新。解决方法

2022-02-17 18:12:02 1554

原创【文献阅读】Accurate Large Minibatch SGD Training ImageNet in 1 hour

摘要：问题：大网络和大数据集导致训练时间增长，distributed synchronous SGD通过划分SGD minibatches over a pool of parallel workers 解决这个问题，然而per-worker workload 必须大，导致了nontrivial growth in SGD minibatch size, 削弱了效率。在imagenet数据集上大的minibatch导致优化困难，但是当addressed的时候网络能没有精度损失。方法：1. 使用了hy

2022-02-10 01:45:36 1910

原创【文献阅读】Applied Machine Learning at Facebook: A Datacenter Infrastructure Perspective

摘要支持机器学习的软件和硬件结构。挑战：传送数据给高性能分布式训练flow。大量计算1.Introduction本文介绍了支持机器学习Facebook的数据中心基础架构的几个重要方面。基础设施包括内部的“ML-as a -Service” flow，开源机器学习框架和分布式训练算法。硬件采用CPU和GPU集群。massive amount of data for ML. 给模型送数据的技术包括：decouple of data feed and training, data/compute co

2022-02-10 01:43:18 563 1

原创如何在linux服务器上部署conda和pytorch

安装minicondaLogin to Ibex using your KAUST credentials.ssh $USERNAME@ilogin.ibex.kaust.edu.sa # use glogin.kaust.edu.sa if you need GPU nodesClone this git repository in your Ibex home directory.cd ~/git clone https://github.com/kaust-rccl/ibex-minico

2022-01-28 18:41:07 2183

原创 caffe 删除caffemodel中模型参数

最近在caffe框架上做硬剪枝，记录下如何改变caffemodel里面的参数原模型结构。。。前面省略了。。。layer { name: "conv2_1" type: "Convolution" bottom: "pool1" top: "conv2_1" convolution_param { num_output: 128 pad: 1 kernel_size: 3 }}layer { name: "relu2_1" type: "ReL

2021-06-03 09:56:24 150

原创 HDLbits错题

1.BCDadd100参考HDLBits Day5 Bcdadd100变量下标中有变量的情况注意大小端表示步骤注意整个工程大小端必须一致1.定义的变量是大端还是小端模式2.看升序（+：）还是降序（-：）3.看位宽并进行转换定义reg [31:0] big_vect;reg [0:31] little_vect;解释big_vect [0 +: 8] 从0 开始，升序，位宽为8 ======》》》》》big_vect [7 :0]little_vect

2021-05-19 17:12:19 468

原创 PPT做的图插入word变糊解决方案

1.ppt导出的png/jpg插入word后导出pdf-右下角工具-压缩图片-高保真2.ppt导出图片选择格式emf，再把emf插入到word中

2021-04-27 19:46:46 5198

转载 torch.save 时报错Can‘t pickle local object ‘BasicBlock.init.＜locals＞.＜lambda＞‘

保存模型虽然没有明白是什么原因，但是找到了解决方法：将torch.save(model, path) # 直接保存整个模型方法改为torch.save(model.state_dict(), path) # 保存模型的参数载入模型相应的，载入模型时将model = torch.load(path) # 直接加载模型方法改为model = Model() # 先初始化一个模型model.load_state_dict(torch.load(path)) # 再加载模型参数————————————

2021-04-02 21:52:39 1022

原创解决“移动硬盘出现文件被占用”的问题

1.打开事件查看器，选择退出硬盘，查看系统，这时候应该显示有一个警告，右键查看是哪个进程阻止了硬盘退出。2.下载process hacker，右上角搜索该进程名字，kill掉该进程3.再次点击退出硬盘...

2021-03-13 16:14:54 4509

转载【转载】ubuntu16.04安装显卡驱动

转载自：https://blog.csdn.net/qq_32408773/article/details/84111244小米笔记本安装双系统后，打算在Ubuntu下安装显卡驱动，前几周在网上找了篇看起来很详细的教程，按照步骤装下去之后出现循环登录的问题，晕晕晕，解决该问题后重新在网上查找了相关文档，总结出一套能够顺利安装的方法。在安装的过程中借鉴了下面几篇文档，感谢：https://blog.csdn.net/linhai1028/article/details/79445722https:/

2020-10-20 09:20:25 606

原创 python plt保存图片去掉边框

plt.imshow(show_re)plt.axis('off')plt.savefig("1.png")plt.show()这样就可以去掉plt输出图像的坐标轴

2020-09-14 16:02:14 4954

原创 PCA图像压缩和重建

PCA进行图像压缩参考https://blog.csdn.net/program_developer/article/details/80632779在新坐标系中得到了新坐标，即原文章中的之后需要映射回原始坐标系，进行图像的重建

2020-09-09 11:01:20 1368

转载使用caffe自动测试模型top5的结果

方法很简单，直接在定义网络的prototxt里面最后加一层就可以了。这一层定义如下layer { name: "accuracy_5" type: "Accuracy" bottom: "fc8_sum" bottom: "label" top: "accuracy_5" accuracy_param { top_k:5 } include { phase: TEST }}转载于:https://www.cnblogs.com/cj695/p

2020-08-19 10:30:05 146

原创 vscode库函数断点调试

参考：https://blog.csdn.net/zlb872551601/article/details/105354738/https://www.zhihu.com/question/325986647想给库函数打断点进行调试，直接在库函数里打断点没有用，参考了VScode如何Debug(调试)进入标准库文件/第三方包源码，在首选项里面把justmycode改成了false。还是不行。然后知乎上看到了用VSCode调试Python,如何才能进入自己写的包并在断点处暂停？，把要调试的包复制到工作

2020-08-03 18:42:02 1476

转载 PCA的数学原理

本文转载自http://blog.codinglabs.org/articles/pca-tutorial.htmlPCA（Principal Component Analysis）是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示，可用于提取数据的主要特征分量，常用于高维数据的降维。网上关于PCA的文章有很多，但是大多数只描述了PCA的分析过程，而没有讲述其中的原理。这篇文章的目的是介绍PCA的基本数学原理，帮助读者了解PCA的工作机制是什么。当然我并不打算把文章写成

2020-07-30 10:10:33 133

原创 Matlab查看mat文件大小

参考https://www.ilovematlab.cn/thread-78257-1-1.html

2020-06-15 15:37:36 3441

转载 COMPRESSION OF DEEP CONVOLUTIONAL NEURAL NETWORKS FOR FAST AND LOW POWER MOBILE APPLICATIONS论文解读

转载COMPRESSION OF DEEP CONVOLUTIONAL NEURAL NETWORKS FOR FAST AND LOW POWER MOBILE APPLICATIONS论文解读，原文只有百度快照了链接如下：http://cache.baiducontent.com/c?m=9d78d513d9921cf01aadc33f4c4d8a3a0e54f13e68c0d0642983c40a84642a101a3aa7e67965565f8e992f3916af3800bdb776216914

2020-06-09 21:55:39 649

原创低秩分解

https://www.cnblogs.com/missidiot/p/9869182.html

2020-06-03 16:43:43 596

原创如何理解范数和正则项

参考：https://zhuanlan.zhihu.com/p/26884695https://medium.com/mlreview/l1-norm-regularization-and-sparsity-explained-for-dummies-5b0e4be3938ahttps://rorasa.wordpress.com/2012/05/13/l0-norm-l1-norm-l2-norm-l-infinity-norm/

2020-05-31 19:44:58 350

原创 top1 top5错误率概念

top-1 error 和 top-5 error首先是TOP-5正确率，举个例子，比如你训练好了一个网络，你要用这个网络去进行图片分类任务，那我假设要分类的数目有50类，那么当我进行测试时，我输入一张图片，网络会依次输出这50个类别的概率，当所有图片测试完成后，那么：TOP-5正确率就是说，在测试图片的50个分类概率中，取前面5个最大的分类概率，正确的标签（分类）有没有在里面，就是它是不是这前5个中的一个，如果是，就是分类成功，那么他的TOP-5正确率此时等于：所有测试图片中正确标签在前五个分类概率的

2020-05-24 10:43:45 1974

原创 win10下安装CUDA失败

环境：win10+VS2015+CUDA8.0+CUDAVisualStudioIntegration找不到参考：https://blog.csdn.net/weixin_43959214/article/details/88935713和进阶版 https://blog.csdn.net/jin739738709/article/details/80819441需要注意后面一个链接中有两个问题需要注意：1.“第一，VS安装的时候在C盘和D盘都会创建一个“Microsoft Visual Stud

2020-05-16 20:54:09 1170 1

原创 ISE modelsim仿真报错解决方法

ISE modelsim仿真遇到了这个报错WARNING: unable to resolve env var in modelsim.ini file entry: $::env(MODEL_TECH)/…/stdWARNING: unable to resolve env var in modelsim.ini file entry: $::env(MODEL_TECH)/…/ieee...

2020-04-29 15:14:36 3039 1

caffe自带的mnist例程中，转换后的训练集mnist_train_lmbd和测试集mnist_test_lmdb

空空如也