- 博客(41)
- 资源 (1)
- 收藏
- 关注
原创 hls4ml 从github源码安装
https://blog.csdn.net/weixin_39950057/article/details/110273007git clone完事儿之后,激活conda环境,python setup.py install
2022-06-28 23:19:39 496 1
原创 Ubuntu18.04安装hls4ml+tensorflow-gpu
主要分为两部分,一部分是安装hls4ml另一个是安装gpu 版本的tensorflow,比较难安装的是tfhttps://github.com/fastmachinelearning/hls4ml-tutorial不然报错”AttributeError: module ‘tensorflow.keras.layers’ has no attribute ‘MultiHeadAttention’根据https://github.com/fastmachinelearning/hls4ml/issues/514
2022-06-25 20:34:05 2610
原创 tensorflow报错Could not load dynamic library ‘libcudnn.so.8
https://github.com/tensorflow/tensorflow/issues/45200输入
2022-06-22 16:30:06 179
原创 HLS4ML报错The board_part definition was not found for tul.com.tw:pynq-z2:part0:1.0.
运行HLS4ML tutorial 7报错这个是复制的别人的报错,我报错的是pynq-z2解决方案然后查看board.repoPaths,输入验证一下这个路径包含文件4. 然后在回去运行
2022-06-19 00:29:19 1584 1
原创 HLS4ML/vivado HLS 报错解决方案
报错内容原因是因为GCC文件冲突,这里用的是vivado2019.2解决方案:在每个源文件(main.cpp和test.cpp)头顶添加下面语句参考:
2022-06-15 16:47:53 1941
原创 Dynamic-OFA: Runtime DNN Architecture Switching for Performance Scaling on Heterogeneous Embedd Pla
CSDN太难用了。。。以后将转战知乎。。。文献阅读:Dynamic-OFA: Runtime DNN Architecture Switching for Performance Scaling on Heterogeneous Embedded Platforms本文用LUT做的run-time management, 就是在offline中先用accuracy predictor和latency predictor去预测sub-network延迟和acc,然后存在LUT里,在runtime的时候o
2022-05-17 03:40:39 171
原创 vncserver +tigervnc 黑屏解决方案
https://askubuntu.com/questions/1208482/vnc-remote-desktop-screen-is-black用vncserver登录服务器,一直黑屏解决方案:我的服务器账号登录之后默认是conda的base模式,需要先退出baseconda deactivate再运行vncserver -geometry 1920x1080再在tigervnc上正常登录......
2022-05-16 15:15:12 3041
原创 【pytorch】Could not load dynamic library ‘libcudart.so.11.0‘;
Could not load dynamic library 'libcudart.so.11.0';我用的conda环境,在/home/anaconda3/envs/环境名字/lib文件夹下面能找到libcudart.so.11.0 文件, 但是import 的时候显示2022-04-25 10:19:13.667333: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic lib
2022-04-25 16:43:03 1384
转载 SSH免密登录
转载自 https://blog.csdn.net/jeikerxiao/article/details/84105529SSH 三步解决免密登录1.客户端生成公私钥2.上传公钥到服务器3.测试免密登录1.客户端生成公私钥本地客户端生成公私钥:(一路回车默认即可)ssh-keygen上面这个命令会在用户目录.ssh文件夹下创建公私钥```bashcd ~/.sshls下创建两个密钥:id_rsa (私钥)id_rsa.pub (公钥)# 2.上传公钥到服务器这里测
2022-03-09 14:51:48 113
原创 【文献阅读】ShEF: Shielded Enclaves for Cloud FPGAs
吐了,好tm难懂问题:secure the FPGA-based accelerator存在问题:现有加密算法计算复杂,依赖CPU的library, 不同应用的安全需求不同,CPU的TEE不能直接在FPGA运行。现有FPGA加速器现有用于accelerator TEE存在问题:不能防御direct physical attacks, require fundamental hardware changes, address isolated challenges, rely on external
2022-03-04 22:12:00 267
原创 如何链接实验室服务器
实验室服务器1.ssh username@kw61087.kaust.edu.sa (kw61159 vitis)2.vncserver -geometry 1920x1080 (打开图形界面)3.tigervnc激活环境服务器输入1.conda activate cs323n2.jupyter notebook --no-browser --port=8889本机终端输入3.ssh -N -f -L localhost:8888:localhost:8889 username@kw610
2022-03-01 19:06:05 33905
原创 远程访问服务器Jupyter Notebook的两种方法
转载:https://www.jianshu.com/p/8fc3cd032d3c方法1. ssh远程使用jupyter notebook在远程服务器上,启动jupyter notebooks服务:jupyter notebook --no-browser --port=8889在本地终端中启动SSH:ssh -N -f -L localhost:8888:localhost:8889 username@serverIP其中: -N 告诉SSH没有命令要被远程执行; -f 告诉SSH在后台执
2022-02-26 22:17:28 7105
原创 【文献阅读】Cross-VM Information Leaks in FPGA-Accelerated Cloud Environments
摘要:对FPGA和相关资源的low-level access像PCIe, SSD, DRAM等容易收到恶意攻击,本文提出了一个新的快速PCIe-contention-based channel,实现不同FPGA加速虚拟机上转移数据。该PCIe receiver circuit能够不同虚拟机之间泄露信息:收到covert transmission(隐蔽传输),细粒度监控PCIe bus,从通过其他人PCIe traffic signature检测从其他人的FPGA加速虚拟机的不同种类的活动。还能长期监
2022-02-26 03:11:59 158
原创 【文献阅读】Remote Power Attacks on the Versatile Tensor Accelerator in Multi-Tenant FPGAs
在FPGA上实现基于功耗的侧信道攻击,实现得到multi-tenant上victim的模型信息。现有针对FPGA远程攻击方案较少,现有方案需要物理接触的限制。实现在multi-tenant fpga上实现了对VTA进行攻击,通过TDC检测VTA执行能量消耗,逆向工程得到在VTA上执行模型的结构和层的类型。创新点是不需要物理接触、不需要监控bus和memory,不需要提前知道模型细节。之前提出的攻击方案没有考虑到VTA利用TLPP并行执行多条指令。难点在于VTA使用statically-schedul
2022-02-25 19:32:07 499
原创 【文献阅读】Fingerprinting Cloud FPGA Infrastructures
开源:https://caslab.csl.yale.edu/code/cloud-fpga-fingerprinting摘要:问题:攻击者不需要攻击和损害FPGA云,能够了解什么。探索FPGA特点能够被利用初始化PUF用于识别不同的FPGA板子。通过从FPGA DRAM中提取FPGA PUF指纹识别FPGA云。现有攻击FPGA云的方法Multi-tenant和temporal convert communication攻击基于能够确定与被攻击者使用相同的板子的假设,本文通过Dacay-based P
2022-02-25 01:31:51 271
原创 【文献阅读未遂】Understanding data storage and ingestion for large-scale deep recommendation model training
Understanding data storage and ingestion for large-scale deep recommendation model training不咋好读,不太懂摘要问题:Domain-specific accelerator特定领域加速器合并进数据中心尺度的集群,增加大数据集的训练的有效性和吞吐量,data storage and ingestion pipeline (DSI) 和 用于存储和预处理训练数据的系统和硬件限制训练能力。DSI系统需要创新。解决方法
2022-02-17 18:12:02 1554
原创 【文献阅读】Accurate Large Minibatch SGD Training ImageNet in 1 hour
摘要:问题: 大网络和大数据集导致训练时间增长,distributed synchronous SGD通过划分SGD minibatches over a pool of parallel workers 解决这个问题,然而per-worker workload 必须大,导致了nontrivial growth in SGD minibatch size, 削弱了效率。在imagenet数据集上大的minibatch导致优化困难,但是当addressed的时候网络能没有精度损失。方法:1. 使用了hy
2022-02-10 01:45:36 1910
原创 【文献阅读】Applied Machine Learning at Facebook: A Datacenter Infrastructure Perspective
摘要支持机器学习的软件和硬件结构。挑战:传送数据给高性能分布式训练flow。大量计算1.Introduction本文介绍了支持机器学习Facebook的数据中心基础架构的几个重要方面。 基础设施包括内部的“ML-as a -Service” flow,开源机器学习框架和分布式训练算法。硬件采用CPU和GPU集群。massive amount of data for ML. 给模型送数据的技术包括:decouple of data feed and training, data/compute co
2022-02-10 01:43:18 563 1
原创 如何在linux服务器上部署conda和pytorch
安装minicondaLogin to Ibex using your KAUST credentials.ssh $USERNAME@ilogin.ibex.kaust.edu.sa # use glogin.kaust.edu.sa if you need GPU nodesClone this git repository in your Ibex home directory.cd ~/git clone https://github.com/kaust-rccl/ibex-minico
2022-01-28 18:41:07 2183
原创 caffe 删除caffemodel中模型参数
最近在caffe框架上做硬剪枝,记录下如何改变caffemodel里面的参数原模型结构。。。前面省略了。。。layer { name: "conv2_1" type: "Convolution" bottom: "pool1" top: "conv2_1" convolution_param { num_output: 128 pad: 1 kernel_size: 3 }}layer { name: "relu2_1" type: "ReL
2021-06-03 09:56:24 150
原创 HDLbits错题
1.BCDadd100参考HDLBits Day5 Bcdadd100变量下标中有变量的情况注意大小端表示步骤 注意整个工程大小端必须一致1.定义的变量是大端还是小端模式2.看升序(+:)还是降序(-:)3.看位宽并进行转换定义reg [31:0] big_vect;reg [0:31] little_vect;解释big_vect [0 +: 8] 从0 开始,升序,位宽为8 ======》》》》》big_vect [7 :0]little_vect
2021-05-19 17:12:19 468
原创 PPT做的图插入word变糊解决方案
1.ppt导出的png/jpg插入word后导出pdf-右下角工具-压缩图片-高保真2.ppt导出图片选择格式emf,再把emf插入到word中
2021-04-27 19:46:46 5198
转载 torch.save 时报错Can‘t pickle local object ‘BasicBlock.__init__.<locals>.<lambda>‘
保存模型虽然没有明白是什么原因,但是找到了解决方法:将torch.save(model, path) # 直接保存整个模型方法改为torch.save(model.state_dict(), path) # 保存模型的参数载入模型相应的,载入模型时将model = torch.load(path) # 直接加载模型方法改为model = Model() # 先初始化一个模型model.load_state_dict(torch.load(path)) # 再加载模型参数————————————
2021-04-02 21:52:39 1022
原创 解决“移动硬盘出现文件被占用”的问题
1.打开事件查看器,选择退出硬盘,查看系统,这时候应该显示有一个警告,右键查看是哪个进程阻止了硬盘退出。2.下载process hacker,右上角搜索该进程名字,kill掉该进程3.再次点击退出硬盘...
2021-03-13 16:14:54 4509
转载 【转载】ubuntu16.04安装显卡驱动
转载自:https://blog.csdn.net/qq_32408773/article/details/84111244小米笔记本安装双系统后,打算在Ubuntu下安装显卡驱动,前几周在网上找了篇看起来很详细的教程,按照步骤装下去之后出现循环登录的问题,晕晕晕,解决该问题后重新在网上查找了相关文档,总结出一套能够顺利安装的方法。在安装的过程中借鉴了下面几篇文档,感谢:https://blog.csdn.net/linhai1028/article/details/79445722https:/
2020-10-20 09:20:25 606
原创 python plt保存图片去掉边框
plt.imshow(show_re)plt.axis('off')plt.savefig("1.png")plt.show()这样就可以去掉plt输出图像的坐标轴
2020-09-14 16:02:14 4954
原创 PCA图像压缩和重建
PCA进行图像压缩参考https://blog.csdn.net/program_developer/article/details/80632779在新坐标系中得到了新坐标,即原文章中的之后需要映射回原始坐标系,进行图像的重建
2020-09-09 11:01:20 1368
转载 使用caffe自动测试模型top5的结果
方法很简单,直接在定义网络的prototxt里面最后加一层就可以了。这一层定义如下layer { name: "accuracy_5" type: "Accuracy" bottom: "fc8_sum" bottom: "label" top: "accuracy_5" accuracy_param { top_k:5 } include { phase: TEST }}转载于:https://www.cnblogs.com/cj695/p
2020-08-19 10:30:05 146
原创 vscode库函数断点调试
参考:https://blog.csdn.net/zlb872551601/article/details/105354738/https://www.zhihu.com/question/325986647想给库函数打断点进行调试,直接在库函数里打断点没有用,参考了VScode如何Debug(调试)进入标准库文件/第三方包源码,在首选项里面把justmycode改成了false。还是不行。然后知乎上看到了用VSCode调试Python,如何才能进入自己写的包并在断点处暂停?,把要调试的包复制到工作
2020-08-03 18:42:02 1476
转载 PCA的数学原理
本文转载自http://blog.codinglabs.org/articles/pca-tutorial.htmlPCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的原理。这篇文章的目的是介绍PCA的基本数学原理,帮助读者了解PCA的工作机制是什么。当然我并不打算把文章写成
2020-07-30 10:10:33 133
转载 COMPRESSION OF DEEP CONVOLUTIONAL NEURAL NETWORKS FOR FAST AND LOW POWER MOBILE APPLICATIONS论文解读
转载COMPRESSION OF DEEP CONVOLUTIONAL NEURAL NETWORKS FOR FAST AND LOW POWER MOBILE APPLICATIONS论文解读,原文只有百度快照了链接如下:http://cache.baiducontent.com/c?m=9d78d513d9921cf01aadc33f4c4d8a3a0e54f13e68c0d0642983c40a84642a101a3aa7e67965565f8e992f3916af3800bdb776216914
2020-06-09 21:55:39 649
原创 如何理解范数和正则项
参考:https://zhuanlan.zhihu.com/p/26884695https://medium.com/mlreview/l1-norm-regularization-and-sparsity-explained-for-dummies-5b0e4be3938ahttps://rorasa.wordpress.com/2012/05/13/l0-norm-l1-norm-l2-norm-l-infinity-norm/
2020-05-31 19:44:58 350
原创 top1 top5错误率概念
top-1 error 和 top-5 error首先是TOP-5正确率,举个例子,比如你训练好了一个网络,你要用这个网络去进行图片分类任务,那我假设要分类的数目有50类,那么当我进行测试时,我输入一张图片,网络会依次输出这50个类别的概率,当所有图片测试完成后,那么:TOP-5正确率就是说,在测试图片的50个分类概率中,取前面5个最大的分类概率,正确的标签(分类)有没有在里面,就是它是不是这前5个中的一个,如果是,就是分类成功,那么他的TOP-5正确率此时等于:所有测试图片中正确标签在前五个分类概率的
2020-05-24 10:43:45 1974
原创 win10下安装CUDA失败
环境:win10+VS2015+CUDA8.0+CUDAVisualStudioIntegration找不到参考:https://blog.csdn.net/weixin_43959214/article/details/88935713和进阶版 https://blog.csdn.net/jin739738709/article/details/80819441需要注意后面一个链接中有两个问题需要注意:1.“第一,VS安装的时候在C盘和D盘都会创建一个“Microsoft Visual Stud
2020-05-16 20:54:09 1170 1
原创 ISE modelsim仿真报错解决方法
ISE modelsim仿真遇到了这个报错WARNING: unable to resolve env var in modelsim.ini file entry: $::env(MODEL_TECH)/…/stdWARNING: unable to resolve env var in modelsim.ini file entry: $::env(MODEL_TECH)/…/ieee...
2020-04-29 15:14:36 3039 1
caffe自带的mnist例程中,转换后的训练集mnist_train_lmbd和测试集mnist_test_lmdb
2020-07-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人