- 博客(14)
- 资源 (1)
- 收藏
- 关注
转载 学习SVM(一) SVM模型训练与分类的OpenCV实现
学习SVM(一) SVM模型训练与分类的OpenCV实现 学习SVM(二) 如何理解支持向量机的最大分类间隔 学习SVM(三)理解SVM中的对偶问题 学习SVM(四) 理解SVM中的支持向量(Support Vector) 学习SVM(五)理解线性SVM的松弛因子Andrew Ng 在斯坦福大学的机器学习公开课上这样评价支持向量机: support vector machines is the s...
2018-03-17 16:09:11 1786
转载 cuda 函数前缀:device/global/host 相关问题
在深度学习caffe框架等多处,用到了CUDA函数,使代码加速,其文件类型为XXX.cu。在运行这些CUDA函数时,会遇到一下C++里没有的问题,比如函数前缀问题,如果在修改编写.cu文件时不注意,会出现问题,因此本文在这里讨论一下。主要解决如下问题:error : calling a __host__ function from a __global__ function is not allo...
2018-03-14 10:49:16 891
转载 #pragma unroll
CUDA在给出的实例程序中出现了不少次的 #prama unroll 的用法,搜集到资料整理如下:1. 官方文档 CUDA C PROGRAMMING GUIDE v6.5 中给出的说明:By default, the compiler unrolls small loops with a known trip count. The #pragma unroll directive however...
2018-03-13 15:51:08 3685
转载 C++——多线程编程(一)std::thread
(一)与C++11多线程相关的头文件C++11 新标准中引入了四个头文件来支持多线程编程,他们分别是< atomic> ,< thread>,< mutex>,< condition_variable>和< future>。 •< atomic>:该头文主要声明了两个类, std::atomic 和 std::atomic_f...
2018-03-12 15:07:41 556
转载 CUDA编程-(2)其实写个矩阵相乘并不是那么难
程序代码及图解析:123456789101112131415161718#include <iostream>#include "book.h"__global__ void add( int a, int b, int *c ) { *c = a + b;}int main( void ) { int c; int *dev_c; HANDLE_ERROR( ...
2018-03-09 10:54:44 506
转载 CUDA线程协作之共享存储器“__shared__”&&“__syncthreads()”
在GPU并行编程中,一般情况下,各个处理器都需要了解其他处理器的执行状态,在各个并行副本之间进行通信和协作,这涉及到不同线程间的通信机制和并行执行线程的同步机制。共享内存“__share__”CUDA中的线程协作主要是通过共享内存实现的。使用关键字“__share__”声明共享变量,将使这个变量驻留在共享内存中,该变量具有以下特征:位于线程块的共享存储器空间中与线程块具有相同的生命周期仅可通过块内...
2018-03-09 02:25:52 1547 1
转载 【CUDA学习】__syncthreads的理解
__syncthreads()是cuda的内建函数,用于块内线程通信.__syncthreads() is you garden variety thread barrier. Any thread reaching the barrier waits until all of the other threads in that block also reach it. It isdesigned...
2018-03-09 02:21:45 2598
转载 CUDA笔记2:概念理解
CUDA基本概念:CUDA全称是ComputeUnified Device Architecture,中文名称即统一计算设备架构,它是NVIDIA公司提出了一种通用的并行计算平台和编程模型。使用CUDA,我们可以开发出同时在CPU和GPU上运行的通用计算程序,更加高效地利用现有硬件进行计算。并行编程的中心思想是分而治之:将大问题划分为一些小问题,再把这些小问题交给相应的处理单元并行地进行处理。在C...
2018-03-09 01:10:28 371
转载 CUDA中的常量内存__constant__
GPU包含数百个数学计算单元,具有强大的处理运算能力,可以强大到计算速率高于输入数据的速率,即充分利用带宽,满负荷向GPU传输数据还不够它计算的。CUDA C除全局内存和共享内存外,还支持常量内存,常量内存用于保存在核函数执行期间不会发生变化的数据,使用常量内存在一些情况下,能有效减少内存带宽,降低GPU运算单元的空闲等待。使用常量内存提升性能使用常量内存可以提升运算性能的原因如下:对常量内存的单...
2018-03-08 01:32:17 2735
转载 cuda 函数前缀:device/global/host 相关问题
在深度学习caffe框架等多处,用到了CUDA函数,使代码加速,其文件类型为XXX.cu。在运行这些CUDA函数时,会遇到一下C++里没有的问题,比如函数前缀问题,如果在修改编写.cu文件时不注意,会出现问题,因此本文在这里讨论一下。主要解决如下问题:error : calling a __host__ function from a __global__ function is not allo...
2018-03-08 01:25:15 1199
转载 Facebook开源AI对话研究平台ParlAI ,解决人机对话最常见5类问题
几乎每篇研究者都说自己提出的漂亮模型是最先进的。AI 研究很难从表面上判断论文的价值编者按:本文由微信公众号“新智元”(ID:AI_era)编译, 来源:Facebook、Techcrunch;36氪经授权发布。Facebook近日宣布开源其AI对话研究平台 ParlAI ,集合了常见的20多个数据集,解决人机对话中最常见的5类问题。Fortune 报道称,Facebook的目标是让计算机与人类进...
2018-03-07 17:32:32 1704
转载 Github 最新 AI 开源项目了解一下?
这是 PaperDaily 的第 48篇文章DeepPavlov#对话系统训练开源库DeepPavlov 是一个基于 TensorFlow 和 Keras 的智能对话库,其主要用途在于推动 NLP 和对话系统的研究,提升复杂对话系统的实现和评价效果。DeepPavlov 可为研究者提供:用于实现和测试对话模型的框架一系列预训练的 NLP 模型、预定义的对话系统组件(机器学习/深度学习/规则系统)和...
2018-03-07 17:24:55 1874
转载 谷歌新一代WaveNet :深度学习怎么生成语音? | 2分钟论文
这里是,雷锋字幕组编译的Two minutes paper专栏,每周带大家用碎片时间阅览前沿技术,了解AI领域的最新研究成果。原标题 NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS | Two Minute Papers翻译 | 张锋凯 整理 | 凡江 林尤添在往期的2分钟论文栏目中,我们有谈...
2018-03-07 17:22:31 4495
转载 干货 | 深度学习时代的目标检测算法
AI 科技评论按:本文作者 Ronald,首发于作者的知乎专栏「炼丹师备忘录」,AI 科技评论获其授权转发。目前目标检测领域的深度学习方法主要分为两类:two stage 的目标检测算法;one stage 的目标检测算法。前者是先由算法生成一系列作为样本的候选框,再通过卷积神经网络进行样本分类;后者则不用产生候选框,直接将目标边框定位的问题转化为回归问题处理。正是由于两种方法的差异,在性能上也有...
2018-03-07 17:18:17 21629 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人