神经网络搞得人神经
文章平均质量分 92
神经网络学习笔记和实验记录
清川先生
上海交大计算机博士在读,博客已迁移到:https://www.zhihu.com/people/liu-ji-27-94
展开
-
C语言底层搭建CNN实现MNIST手写数字识别
本工程使用C99标准的纯C语言(不使用STL)编写了CNN,实现在MNIST数据集上的手写数字识别。本文目的是为将来在FPGA等更底层的边缘设备上实现CNN做铺垫,当然CNN的训练过程在服务器上进行,推断过程在边缘端进行,那么我们的目的就是开发一个同时支持服务器训练和FPGA推断的项目,或者给出一个通用的研究方法。原创 2019-12-26 21:58:13 · 3205 阅读 · 0 评论 -
Sampled Softmax
论文原文:On Using Very Large Target Vocabulary for Neural Machine Translation 我的研究方向是生成式文本自动摘要,在读2016年Nallapati那篇经典论文的时候,遇到了文中所谓的LVT(large vocabulary ‘trick’)问题,比较感兴趣就读了这篇论文的原文。由于基于神经网络的生成式文本摘要的原始模型就是从NMT...原创 2019-12-11 21:23:20 · 240 阅读 · 0 评论