Mys_GoldenRetriever-CSDN博客

转载【转】Verilog代码优化之case语句

【转自】https://blog.csdn.net/hanghang121/article/details/23449467/Verilog代码优化之case语句题记：那天做完13路脉冲计数并写入dual RAM模块的设计后组长看了我的资源占用，吃惊的说怎么占用资源这么少啊，以为我偷工减料了。呵呵，其实这个也是一直困扰初学者的一个课题，可综合的verilog是一个，最优化的代...

2019-01-10 16:47:54 1276

转载【1】verilog十大基本功——阻塞赋值与非阻塞赋值

原帖见： dancia《高手也搞不清楚的十项基本功》http://www.socvista.com/bbs/search.php?searchid=11&orderby=lastpost&ascdesc=desc&searchsubmit=yes 前言：阻塞与非阻塞赋值是 Verilog 语言中最基本的部分，也是让大部分 Verilog 新手最困惑的地方...

2018-11-06 15:39:19 501

原创【1】verilog十大基本功——阻塞赋值与非阻塞赋值

原帖见：dancia《高手也搞不清楚的十项基本功》http://www.socvista.com/bbs/search.php?searchid=11&orderby=lastpost&ascdesc=desc&searchsubmit=yes 前言：阻塞与非阻塞赋值是Verilog 语言中最基本的部分，也是让大部分Verilog 新手最...

2018-11-06 15:06:49 3165

原创【1】verilog十大基本功——阻塞赋值与非阻塞赋值_一只神秘的大金毛_新浪博客...

原帖见：dancia《高手也搞不清楚的十项基本功》http://www.socvista.com/bbs/search.php?searchid=11&orderby=lastpost&ascdesc=desc&searchsubmit=yes前言：阻塞与非阻塞赋值是Verilog 语言中最基本的部分，也是让大部分Verilog 新手最困惑的地方。关...

2018-11-06 15:06:49 257

转载 Latex图片表格混排

我的文章中要求一幅图片和一个表格并列排在同一行上，并且表格和图形都带有标题，在各自的正下方。模版将图形和表格都是居中的。我试着用了minipage环境{figure环境+tabular环境}，但是\caption{}只能在table下应用，总之图形和表格都好处理，就是他们各自的标题总搞不定！不知哪位高手遇到过这种情况，教我一下！万分感谢【解决方案】minipage 環境，裏...

2018-10-21 13:12:57 4055

原创 Latex图片表格混排_一只神秘的大金毛_新浪博客

我的文章中要求一幅图片和一个表格并列排在同一行上，并且表格和图形都带有标题，在各自的正下方。模版将图形和表格都是居中的。我试着用了minipage环境{figure环境+tabular环境}，但是\caption{}只能在table下应用，总之图形和表格都好处理，就是他们各自的标题总搞不定！不知哪位高手遇到过这种情况，教我一下！万分感谢【解决方案】minipage...

2018-10-21 13:12:57 563

原创【转】BloomFilter布隆滤波器

转自https://blog.csdn.net/zq602316498/article/details/40660235在日常生活中，包括在设计计算机软件时，我们经常要判断一个元素是否在一个集合中。比如在字处理软件中，需要检查一个英语单词是否拼写正确（也就是要判断它是否在已知的字典中）；在FBI，一个嫌疑人的名字是否已经在嫌疑名单上；在网络爬虫里，一个网址是...

2018-09-23 20:24:58 295

原创【转】BloomFilter布隆滤波器_一只神秘的大金毛_新浪博客

转自https://blog.csdn.net/zq602316498/article/details/40660235在日常生活中，包括在设计计算机软件时，我们经常要判断一个元素是否在一个集合中。比如在字处理软件中，需要检查一个英语单词是否拼写正确（也就是要判断它是否在已知的字典中）；在FBI，一个嫌疑人的名字是否已经在嫌疑名单上；在网络爬虫里，一个网址是否被访问过等等。...

2018-09-23 20:24:58 216

转载【转】Bloom Filter 布隆滤波器

转自https://blog.csdn.net/zq602316498/article/details/40660235在日常生活中，包括在设计计算机软件时，我们经常要判断一个元素是否在一个集合中。比如在字处理软件中，需要检查一个英语单词是否拼写正确（也就是要判断它是否在已知的字典中）；在 FBI，一个嫌疑人的名字是否已经在嫌疑名单上；在网络爬虫里，一个网址是否被访问过等等。最直...

2018-09-23 20:24:32 372

原创 Verilog语法笔记_基本概念

语法经常记混淆，忘掉细节，记录一下一些易错和遗忘的地方。一、模块相当于函数 —— module//语法格式 module <模块名> （<模块端口列表>）；。。。<模块内容、功能>；。。。endmodule //ripple_carry_counter(脉动进位计数器)的例子module ripple_car...

2018-08-04 15:38:57 537

原创 Verilog语法笔记_基本概念_一只神秘的大金毛_新浪博客

语法经常记混淆，忘掉细节，记录一下一些易错和遗忘的地方。一、模块相当于函数 —— module//语法格式module <模块名> （<模块端口列表>）；。。。<模块内容、功能>；。。。endmodule//ripple_carry_counter(脉动进位计数器)的例子module ripple_carry_counter (...

2018-08-04 15:38:57 117

原创【ISCA17】SCNN:AnAcceleratorforCompressed-sparseConvolutionalNeuralNetworks

主要设计了一个可以高效处理稀疏化CNN的高效硬件架构，主要思想就是跳过weight和activation中有0的乘法的情况。以达到加速（cycle）和降低功耗的效果。以下按照原文结构，大致概括一下文章的脉络。 ABSTRACT本文设计了一个Sparse CNN (SNN)的加速器硬件架构，通过设计一种压缩的数据流模式，同时探索了weight和activation在硬件中的稀疏...

2018-08-02 16:03:47 1795 1

原创【ISCA17】SCNN:AnAcceleratorforCompressed-sparseConvolutionalNeuralNetworks_一只神秘的大金毛_新浪博客...

主要设计了一个可以高效处理稀疏化CNN的高效硬件架构，主要思想就是跳过weight和activation中有0的乘法的情况。以达到加速（cycle）和降低功耗的效果。以下按照原文结构，大致概括一下文章的脉络。ABSTRACT本文设计了一个SparseCNN (SNN)的加速器硬件架构，通过设计一种压缩的数据流模式，同时探索了weight和activation在硬件中的稀...

2018-08-02 16:03:47 825 1

原创【ICLR2018】《SparsityWinogradCNN》

一、Introduction1、想要结合两种方法：Winograd 和 pruning。2、CNN的乘法数量：AlexNet 1.1x10^9；-> 1.6x10^10。3、文章的两个思路：把ReLU操作移到Winograd变换的后面；在变换之后进行pruning。二、Related Work卷积的线性性质：Cong & Xiao (2014...

2018-08-02 15:54:18 265

原创【FPGA17】EvaluatingFastAlgorithmsforConvolutionalNeuralNetworksonFPGAs

算法如图，比较直观。一、硬件架构设计需要解决如下问题：memorybandwidth。存储读取数据功耗和速度称为瓶颈，速度与conv硬件处理部分不匹配。所以文中很老套的方法，通过line buffer来复用每个tile交叠的部分（垂直和水平都有交叠的部分）。 1、整体架构所有数据（input feature map, filter)都存在外部存储上。有多...

2018-08-02 15:37:52 1009

原创【FPGA17】EvaluatingFastAlgorithmsforConvolutionalNeuralNetworksonFPGAs_一只神秘的大金毛_新浪博客...

算法如图，比较直观。一、硬件架构设计需要解决如下问题：memorybandwidth。存储读取数据功耗和速度称为瓶颈，速度与conv硬件处理部分不匹配。所以文中很老套的方法，通过line buffer来复用每个tile交叠的部分（垂直和水平都有交叠的部分）。1、整体架构所有数据（input feature map, filter)都存在外部存储上。有多通道（M）的in...

2018-08-02 15:37:52 326

原创【韩松】Deep Gradient Comression

《Deep Gradient Compression》作者韩松，清华电子系本科，StanfordPhD，深鉴科技联合创始人。主要的研究方向是，神经网络模型压缩以及硬件架构加速。论文链接：https://arxiv.org/pdf/1712.01887.pdf本篇文章发表在 ICLR 2018，韩松之前有一系列模型压缩的研究，比如其博士毕业论文《EFFICIENT...

2017-12-25 13:51:54 1856

原创【韩松】Deep Gradient Comression_一只神秘的大金毛_新浪博客

《Deep Gradient Compression》作者韩松，清华电子系本科，StanfordPhD，深鉴科技联合创始人。主要的研究方向是，神经网络模型压缩以及硬件架构加速。论文链接：https://arxiv.org/pdf/1712.01887.pdf本篇文章发表在 ICLR 2018，韩松之前有一系列模型压缩的研究，比如其博士毕业论文《EFFICIENT METHODS...

2017-12-25 13:51:54 448

原创【CS231n】十五、深度学习的高效算法和硬件设计

一、大纲emmm，硬件及算法加速部分是博主实验室的主要研究领域，总算可以多说点体会而不是疯狂翻译和贴图了。主讲人是韩松，清华电子系本科，Stanford Phd，深鉴科技创始人之一，主要工作在深度学习的算法和硬件。内容主要分为四个部分（2x2）：算法优化（训练、推理），硬件优化（训练、推理）。也是科研的四个大方向。二、第一部分：Algorithms ...

2017-12-11 11:25:57 574

原创【CS231n】十五、深度学习的高效算法和硬件设计_一只神秘的大金毛_新浪博客...

一、大纲emmm，硬件及算法加速部分是博主实验室的主要研究领域，总算可以多说点体会而不是疯狂翻译和贴图了。主讲人是韩松，清华电子系本科，Stanford Phd，深鉴科技创始人之一，主要工作在深度学习的算法和硬件。内容主要分为四个部分（2x2）：算法优化（训练、推理），硬件优化（训练、推理）。也是科研的四个大方向。二、第一部分：Algorithms for Effi...

2017-12-11 11:25:57 145

原创【何凯明】非局部连接网络 Non-local Neural Network

《Non-local Neural Network》一、主要贡献1.提出了一种非局部连接（Non-localoperations）的计算块 (buildingblock)，用于处理视频和图像的长程依赖关系（long-rangedependency）；2.在视频数据集Kinetics andCharadesdatasets，目前最优（对比2D或3D卷积网...

2017-12-07 14:40:02 1659

原创【何凯明】非局部连接网络 Non-local Neural Network_一只神秘的大金毛_新浪博客...

《Non-local Neural Network》一、主要贡献1.提出了一种非局部连接（Non-localoperations）的计算块 (buildingblock)，用于处理视频和图像的长程依赖关系（long-rangedependency）；2.在视频数据集Kinetics andCharadesdatasets，目前最优（对比2D或3D卷积网络）；3.图像...

2017-12-07 14:40:02 265

原创【百度、NVIDIA】混合精度训练 Mixed Precision Training

《Mixed Precision Training》思路如图1，简单说，权值用32位保存，然后训练过程中截断为16位，而后weight和activation都用FP16来计算，最后更新还是使用FP32的权值。两种方法来控制半精度的信息损失。一、保存一个单精度浮点的权值备份。在训练过程中舍入到半精度。（加速训练？减少硬件开销？但是没有减少存储的参数量）二、适当...

2017-12-07 14:38:05 1114

原创【百度、NVIDIA】混合精度训练 Mixed Precision Training_一只神秘的大金毛_新浪博客...

《Mixed Precision Training》思路如图1，简单说，权值用32位保存，然后训练过程中截断为16位，而后weight和activation都用FP16来计算，最后更新还是使用FP32的权值。两种方法来控制半精度的信息损失。一、保存一个单精度浮点的权值备份。在训练过程中舍入到半精度。（加速训练？减少硬件开销？但是没有减少存储的参数量）二、适当地缩放损失结果...

2017-12-07 14:38:05 197

原创【CS231n】十四、深度强化学习

一、概览1、什么是强化学习？2、马尔科夫决策过程。3、Q-学习。4、策略梯度（Policy Gradients）二、强化学习1、概念：强化学习，假设有一个代理人（Agent，CS中的一个概念，下简写为Agn）和其相应的环境（Environment，下简写为Env）。若Env给Agn一个状态（statest），则Agn给Env一个反馈动作（Action...

2017-11-24 16:15:51 459

原创【CS231n】十四、深度强化学习_一只神秘的大金毛_新浪博客

一、概览1、什么是强化学习？2、马尔科夫决策过程。3、Q-学习。4、策略梯度（Policy Gradients）二、强化学习1、概念：强化学习，假设有一个代理人（Agent，CS中的一个概念，下简写为Agn）和其相应的环境（Environment，下简写为Env）。若Env给Agn一个状态（statest），则Agn给Env一个反馈动作（Actionat）。而后En...

2017-11-24 16:15:51 84

原创【图文教程】搭建私人Git仓库

服务器git使用说明（服务器M40:192.168.124.12） 1. 找到本地客户端（自己的电脑）的ssh公钥。a) Linux系统在根目录（~）下，使用命令ls–a既可以看到隐藏文件夹.ssh。 b) .ssh文件夹里面的.pub后缀的文件即本地客户端的公钥。 c) 复制公钥的内容： d...

2017-11-20 21:24:40 676

原创【图文教程】搭建私人Git仓库_一只神秘的大金毛_新浪博客

服务器git使用说明（服务器M40:192.168.124.12）1.找到本地客户端（自己的电脑）的ssh公钥。a)Linux系统在根目录（~）下，使用命令ls–a既可以看到隐藏文件夹.ssh。b).ssh文件夹里面的.pub后缀的文件即本地客户端的公钥。c)复制公钥的内容：d)假...

2017-11-20 21:24:40 94

原创【CS231n】十三、生成模型（Generative Models）

一、概览二、生成模型定义：无监督学习的一个核心问题，给定具有特定密度分布的数据，想要生成同样密度分布的数据。分类：三、PixelRNN 和 PixelCNN（1）首先定义一个likelihood函数，（2）PixelRNN的方法：从角落的一个像素开始向周围的像素推理，每一个像素的likelihood由周围的决定。问题在于是串行生成，速度很慢。...

2017-11-16 14:28:29 739

原创【CS231n】十三、生成模型（Generative Models）_一只神秘的大金毛_新浪博客

一、概览二、生成模型定义：无监督学习的一个核心问题，给定具有特定密度分布的数据，想要生成同样密度分布的数据。分类：三、PixelRNN 和 PixelCNN（1）首先定义一个likelihood函数，（2）PixelRNN的方法：从角落的一个像素开始向周围的像素推理，每一个像素的likelihood由周围的决定。问题在于是串行生成，速度很慢。（3）Pix...

2017-11-16 14:28:29 241

原创【CS231n】十一、计算机视觉的一些问题：分割、定位、检测

1、语义分割（Semantic Segmentation）给图像的每一个像素（pixel）分入一个类别，每个类别有相应的语义或者标签。分类但不区分实例（instances），比如两只重叠的猫，所有的像素都归为 cat 一类。使用CNN来完成，结构有一些变化，如下：这里需要讨论一下的不同于CNN的操作：（1）上采样 upsampling——Unpooling ...

2017-09-25 16:26:34 265 1

原创【CS231n】十一、计算机视觉的一些问题：分割、定位、检测_一只神秘的大金毛_新浪博客...

1、语义分割（Semantic Segmentation）给图像的每一个像素（pixel）分入一个类别，每个类别有相应的语义或者标签。分类但不区分实例（instances），比如两只重叠的猫，所有的像素都归为 cat 一类。使用CNN来完成，结构有一些变化，如下：这里需要讨论一下的不同于CNN的操作：（1）上采样 upsampling——Unpooling 反池化这样做...

2017-09-25 16:26:34 105

原创【CS231n】十、RNN框架学习笔记

1、基本介绍（1）想法：之前的网络都是前馈（数据流向一个方向）的类型，现在想要让网络的有更多的自由度。而网络的搭建，可以有各种各样复杂的方式：比如输出为可变多维向量，输入为多维可变向量（例文本text、video），多入多出（MachineTranslation），多维输入对应多维输出（video classification on frame level）...

2017-09-18 10:21:18 475

原创【CS231n】十、RNN框架学习笔记_一只神秘的大金毛_新浪博客

1、基本介绍（1）想法：之前的网络都是前馈（数据流向一个方向）的类型，现在想要让网络的有更多的自由度。而网络的搭建，可以有各种各样复杂的方式：比如输出为可变多维向量，输入为多维可变向量（例文本text、video），多入多出（MachineTranslation），多维输入对应多维输出（video classification on frame level）（2）数学抽象...

2017-09-18 10:21:18 72

原创【CS231n】九、CNN架构学习笔记

1、需要学习的一些结构2、奠基性的结构——LeNet-5LeCun在90年代，用于手写数字分类。其数据集MNIST，是深度学习常用的入门训练数据。MNIST数据集的官网是Yann LeCun's website。3、AlexNet（1）背景介绍2012年ImageNet冠军，Hinton的学生，这个事件影响巨大。（2）基本框架基本框架和Le...

2017-09-14 15:51:04 360 1

原创【CS231n】九、CNN架构学习笔记_一只神秘的大金毛_新浪博客

1、需要学习的一些结构2、奠基性的结构——LeNet-5LeCun在90年代，用于手写数字分类。其数据集MNIST，是深度学习常用的入门训练数据。MNIST数据集的官网是Yann LeCun's website。3、AlexNet（1）背景介绍2012年ImageNet冠军，Hinton的学生，这个事件影响巨大。（2）基本框架基本框架和LeNet-5没有本...

2017-09-14 15:51:04 149

原创【官方文档】一、MNIST机器学习入门

第一篇做过纸质版笔记，所以这边就直接搬运了教材：http://wiki.jikexueyuan.com/project/tensorflow-zh/tutorials/mnist_beginners.html1、什么是MNIST？就好比编程入门有HelloWorld，机器学习入门有MNIST。MNIST是一个入门级的计算机视觉数据集，它包含各种手写数字图片：...

2017-09-08 16:43:24 149

原创【官方文档】一、MNIST机器学习入门_一只神秘的大金毛_新浪博客

第一篇做过纸质版笔记，所以这边就直接搬运了教材：http://wiki.jikexueyuan.com/project/tensorflow-zh/tutorials/mnist_beginners.html1、什么是MNIST？就好比编程入门有HelloWorld，机器学习入门有MNIST。MNIST是一个入门级的计算机视觉数据集，它包含各种手写数字图片：它也包含每...

2017-09-08 16:43:24 144

原创【CS231n】八、深度学习软硬件介绍

课程内容提炼：CPU 和 GPU 硬件知识深度学习框架：Caffe / Caffe2Theano / TensorFlowTorch / PyTorch1、CPU & GPU总结来说就是，（众所周知）GPU适合做深度学习。GPU，主要用NVIDIA。GPU深度学习库，NVIDIA独占 CUDA（cuDNN）。OpenCL，支持多种硬件，AMD...

2017-09-08 10:11:56 365

原创【CS231n】八、深度学习软硬件介绍_一只神秘的大金毛_新浪博客

课程内容提炼：CPU 和 GPU 硬件知识深度学习框架：Caffe / Caffe2Theano / TensorFlowTorch / PyTorch1、CPU & GPU总结来说就是，（众所周知）GPU适合做深度学习。GPU，主要用NVIDIA。GPU深度学习库，NVIDIA独占 CUDA（cuDNN）。OpenCL，支持多种硬件，AMD给出了OpenC...

2017-09-08 10:11:56 83

空空如也

空空如也