深度学习
文章平均质量分 95
Xu_youyaxianshen
新手入门,请大家多多关照哇
展开
-
《Attention is All You Need》:深度解读Transformer模型
本文将首先介绍常见的Attention机制,然后详细解读论文《Attention is All You Need》,该论文在NIPS 2017上发表,标志着Attention机制在NLP领域的一个重要里程碑。论文中提出的Transformer模型,以其独特的架构和优异的性能,已经成为当前NLP任务中的主流模型之一。原创 2024-05-13 15:11:31 · 2288 阅读 · 0 评论 -
【《ImageNet Classification with Deep Convolutional Neural Networks》最详细的读后感和代码复现教程】
论文描述了他们训练的深度卷积神经网络,该网络能够对 ImageNet 数据集中的 1.2 百万高分辨率图像进行分类,这些图像被分为 1000 个不同的类别,是一个典型的有监督学习多分类问题。论文中神经网络由卷积层、最大池化层和全连接层组成,激活函数采用了当时全新的Relu,最后使用1000路的softmax作为分类输出,并且使用了“dropout”正则化方法来避免过拟合。他们在测试数据上取得了 top-1 和 top-5 的错误率分别为 37.5% 和 17.0%,这显著优于之前的最佳水平。论文还提到原创 2024-05-10 15:19:19 · 813 阅读 · 1 评论