极链AI云
码龄1年
  • 89,968
    被访问
  • 107
    原创
  • 23,848
    排名
  • 22
    粉丝
关注
提问 私信
  • 加入CSDN时间: 2021-08-03
博客简介:

m0_60673947的博客

查看详细资料
  • 5
    领奖
    总分 949 当月 102
个人成就
  • 获得6次点赞
  • 内容获得8次评论
  • 获得76次收藏
创作历程
  • 62篇
    2022年
  • 56篇
    2021年
成就勋章
TA的专栏
  • 模型部署
    58篇
  • AI周报
    29篇
  • 论文解析
    21篇
  • 平台介绍篇
    2篇
  • 最近
  • 文章
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

ACL2022奖项公布伯克利摘得最佳论文,陈丹琦、杨笛一等华人团队获杰出论文

ACL2022奖项公布伯克利摘得最佳论文,陈丹琦、杨笛一等华人团队获杰出论文刚刚,NLP 领域国际顶会 ACL2022 公布获奖论文信息,其中加州大学伯克利分校的增量句法表示研究被评为最佳论文。此外,最佳主题论文、杰出论文也揭晓。ACL 是计算语言学和自然语言处理领域的顶级国际会议,由国际计算语言学协会组织,每年举办一次。一直以来,ACL 在 NLP 领域的学术影响力都位列第一,它也是 CCF-A 类推荐会议。今年的 ACL 大会已是第 60 届,将于 5 月 22-5 月 27 在...
转载
发布博客 11 小时前 ·
3 阅读 ·
0 点赞 ·
0 评论

【模型复现】无监督文本匹配模型——SimCSE快速复现

SimCSE 模型快速复现教程01模型详情模型简介:SIMCSE是一种用于生成句子嵌入的对比学习框架。它利用了无监督的方法,该方法采用输入句,并以对比目标预测本身,只有标准dropout用作噪声。作者发现dropout行为是隐藏表示的最小“数据增强”,同时删除它导致表示崩溃。之后使用了监督方法将注释对从自然语言推理数据集中包含到对比框架中。关键词:无监督应用场景:文本匹配结构:论文地址:https://arxiv.org/abs/2104.0882..
原创
发布博客 前天 14:38 ·
15 阅读 ·
0 点赞 ·
0 评论

【AI周报】腾讯AI Lab等提出免训练跨模态文本生成框架;DeepMind「通才」AI智能体Gato来了

01行业大事件即插即用、无需训练:剑桥大学、腾讯AI Lab等提出免训练跨模态文本生成框架来自剑桥大学、腾讯AI Lab 等机构的研究者提出了一个全新的框架 MAGIC (iMAge-guided text GeneratIon with CLIP),MAGIC 通过直接插入可控图文匹配模型分数的方式,使得语言模型在解码过程中选择更接近图片信息的生成结果。本文提出了一个全新的 MAGIC (iMAge-guided text GeneratIon with CLIP)框架...
原创
发布博客 2022.05.13 ·
207 阅读 ·
0 点赞 ·
0 评论

深度学习基础篇【1】从0开始搭建YOLOX模型用于训练个人数据集

深度学习基础篇【1】从0开始搭建YOLOX模型用于训练个人数据集YOLOX模型于2021年由开发者Zheng Ge,Songtao Liu,Feng Wang,Zeming Li,Jian Sun在《YOLOX: Exceeding YOLO Series in 2021》首次提出。 YOLOX对YOLO系列的进行一些改进,形成了一种新的高性能探测器。配备了一些新的先进检测技术,即解耦头、无锚点和先进的标签分配策略,YOLOX在速度和精度之间实现了更好的平衡,比所有型号尺寸的其他同类产品都好。值
原创
发布博客 2022.05.13 ·
49 阅读 ·
0 点赞 ·
0 评论

【模型复现】逆合成预测/文本分类模型——MeGAN 快速复现

MeGAN快速复现教程01 镜像详情镜像简介:模型论文2021年5月发表在JCIM上的关于逆合成路线规划一篇文章,标题为《Molecule Edit Graph Attention Network:Modeling Chemical Reactions as Sequences of Graph Edits》,本文提出了分子编辑图注意网络(MEGAN),是一个端到端编码器-解码器神经模型。由于大部分的逆合成实验都是基于数据集USPTO50k以及USPTO-full进行的实验。为了
原创
发布博客 2022.05.11 ·
210 阅读 ·
0 点赞 ·
0 评论

CVPR 2022 | 16万视频对、28万对片段,蚂蚁开源视频侵权检测超大数据集

CVPR 2022 | 16万视频对、28万对片段,蚂蚁开源视频侵权检测超大数据集• CVPR 2022 VCSL 论文:https://arxiv.org/abs/2203.02654•VCSL 数据集和评测以及算法代码:https://github.com/alipay/VCSL• 文章转载自:机器之心• 原文地址:https://www.jiqizhixin.com/articles/2022-05-09-4该研究提出了目前最大规模(超过现有其他数据集...
转载
发布博客 2022.05.10 ·
12 阅读 ·
0 点赞 ·
0 评论

【模型复现】零样本预测文本分类模型——ESM 快速复现模型

ESM快速复现教程01 镜像详情镜像简介:这篇论文《Biological structure and function emerge from scaling unsupervised learning to 250 million protein sequences》 .是2019年2月的文章,发布在biorxiv上。代码中包括来自 Facebook AI Research 的 Transformer 蛋白质语言模型的代码和预训练权重,包括我们最先进的 ESM-1b 和 MSA T
原创
发布博客 2022.05.09 ·
186 阅读 ·
0 点赞 ·
0 评论

极链AI云升级公告

2022年5月6日极链AI云全新升级。这次升级包括网络带宽的扩容和产品性能的提升。升级后,您能感受到更加流畅的实例操作体验以及更加高效的文件传输和读取速度。同时,平台为回馈用户的一路陪伴,推出了性价比超高的租赁服务。例如热门的RTX3080,由4元/小时降至3.3元/小时,用单卡进行一天的模型训练直接能省出一杯奶茶钱!同时平台还在陆续上架A100,P40等多种机型,满足你的各种机器需求。如果你是学生,更有额外的100元云币券和95折租赁优惠~接下来,让我们具体看看这次全新升级,到底能给用户带来什么.
原创
发布博客 2022.05.08 ·
315 阅读 ·
0 点赞 ·
0 评论

【AI周报】谷歌、Meta如何给大模型瘦身?;Meta开放1750亿参数大模型,媲美GPT-3

01 行业大事件谷歌、Meta如何给大模型瘦身?谷歌工程师亲述部署秘籍(免费书)这是一本正在写作的新书,目前前四章已经放出了草稿。过去几年,GPT-3 等几个大模型展示了大数据、大算力的力量,它们的效果毋庸置疑,但在现实世界中训练和部署这些模型是非常昂贵的,这阻碍了大模型在现实世界中的广泛应用,比如很多效果很好的大模型根本无法在手机上运行。因此,我们需要想办法把模型做得更加高效(在尽量不损失性能的前提下把模型做得更小)。那么,具体该怎么做呢?为了解答这个问题,谷歌机器学习..
原创
发布博客 2022.05.08 ·
17 阅读 ·
0 点赞 ·
0 评论

【模型复现】高精度文本匹配/分类模型——consert快速复现

ConSERT快速复现教程01 镜像详情镜像简介:Consert是由2021年的论文《A Contrastive Framework for Self-Supervised Sentence Representation Transfer》提出,现在在深度学习网络中应用越来越广泛。 为解决 BERT原生句子表示这种“坍缩”现象,美团NLP中心知识图谱团队提出了基于对比学习的句子表示迁移方法—— ConSERT,通过在目标领域的无监督语料上Fine-tune,使模型生成的句子表示与下游
原创
发布博客 2022.05.07 ·
104 阅读 ·
0 点赞 ·
0 评论

ViT的复仇:Meta AI提出ViT训练的全新baseline

ViT的复仇:Meta AI提出ViT训练的全新baseline• 论文链接:https://arxiv.org/pdf/2204.07118.pdf• 文章转载自:机器之心• 原文地址:https://www.jiqizhixin.com/articles/2022-05-03-3本文提出了训练视觉 Transformer(ViT)的三种数据增强方法:灰度、过度曝光、高斯模糊,以及一种简单的随机修剪方法 (SRC)。实验结果表明,这些新方法在效果上大大优于 ViT 此前的全监督..
转载
发布博客 2022.05.07 ·
13 阅读 ·
0 点赞 ·
0 评论

ACL 2022复旦、字节等推出首个可解释类比推理数据集,中英双语

ACL 2022复旦、字节等推出首个可解释类比推理数据集,中英双语A bench mark forrationalizing natural language analogical reaoning• 论文链接:https://arxiv.org/abs/2203.08480• 项目主页:https://ekar-leaderboard.github.io文章转载自:机器之心来自复旦大学、字节跳动人工智能实验室等机构的研究者提出E-KAR 数据集,这是首个可解释的知识密集..
转载
发布博客 2022.05.06 ·
27 阅读 ·
0 点赞 ·
0 评论

【模型复现】深度可分离卷积/逆残差结构模型——MobileNetV3快速复现

MobileNetV3快速复现教程01 镜像详情镜像简介:这个模型的文章是由Andrew Howard团队发表在ICCV 2019 上的。文章综合了MobileNetV1的深度可分离卷积(depthwise separable convolutions)和MobileNetV2的具有线性瓶颈的逆残差结构(the inverted residual with linear bottleneck)。首先使用 MnasNet 进行粗略结构的搜索,然后使用强化学习从一组离散的选择中选择最优配
原创
发布博客 2022.05.05 ·
1447 阅读 ·
0 点赞 ·
0 评论

【极链AI云5月6日更新公告】

亲爱的用户:极链AI云作为极链科技集团下属专为AI科研与学习而设计的AI一站式开发平台。自上线之初就备受用户好评。在经历诸多重大更新与调整后,平台现已拥有60个经典模型,65个热门数据集,可通过简单步骤实现快速复现。为用户操作带来极大便利。为了给用户带来更好的使用体验,平台将于5月6日进行全面升级,本次升级将有效解决实例卡顿问题、提升文件传输速度、大幅提高/user-data读写速度。同时,我们也将推出性价比更高的机器。平台在升级后,4K 异步写入速度可达30k iops,单文件异步写入速度
原创
发布博客 2022.05.02 ·
90 阅读 ·
0 点赞 ·
0 评论

【AI周报】国产框架OneFlow兼容PyTorch,25倍性能加速;DeepMind新型800亿模型表现优秀

01 行业大事件兼容PyTorch,25倍性能加速,国产框架OneFlow「超速」了要想炼丹爽得飞起,就要选择一个顺手的炉子。作为 AI 工程师日常必不可缺的「炼丹炉」,「PyTorch 还是TensorFlow?」已成为知乎、Reddit 等炼丹师出没之地每年都会讨论的热门话题。业界流传一种说法:PyTorch 适合学术界,TensorFlow适合工业界。毕竟,PyTorch 是用户最喜欢的框架,API 非常友好,Eager 模式让模型搭建和调试过程变得更加容易,不过,它的静态...
原创
发布博客 2022.04.30 ·
111 阅读 ·
0 点赞 ·
0 评论

MGO-GAN:利用正交向量缓解GAN训练时模式崩溃的问题

MGO-GAN:利用正交向量缓解GAN训练时模式崩溃的问题Tackling mode collapse in multi-generator GANs with orthogonal vectors论文地址:https://www.sciencedirect.com/science/article/abs/pii/S0031320320304490#section-cited-by本文转发自知乎作者: 记忆的迷谷本文《Tackling mode collapse in multi-g..
转载
发布博客 2022.04.29 ·
12 阅读 ·
0 点赞 ·
0 评论

CVPR 2022 | 高质量捕捉人物动作,网易互娱AI Lab提出高效视频动捕技术

CVPR 2022 | 高质量捕捉人物动作,网易互娱AI Lab提出高效视频动捕技术Spatial-Temporal Parallel Transformer for Arm-Hand Dynamic Estimation原文地址:CVPR 2022 | 高质量捕捉人物动作,网易互娱AI Lab提出高效视频动捕技术 | 机器之心转发自:机器之心论文地址:https://arxiv.org/pdf/2203.16202.pdfiCap是网易互娱AI Lab研发的一款产品级的视觉动.
转载
发布博客 2022.04.28 ·
75 阅读 ·
0 点赞 ·
0 评论

【模型复现】卷积网络目标检测模型——UNet 快速复现

UNet 模型快速复现教程01 模型详情模型简介:这篇论文《UNet++: A Nested U-Net Architecture for Medical Image Segmentation》是2018年6月的文章,DLMIA2018会议。文章对Unet改进的点主要是skip connection。UNET利用卷积网络的典型利用是在分类任务,输出任务的单个类标签。然而,在许多视觉任务,尤其是生物医学图像处理,目标输出应该包括定位等,每个像素都应该有类标签。另外,大量的训练图片往往.
原创
发布博客 2022.04.27 ·
580 阅读 ·
0 点赞 ·
0 评论

【模型复现】孪生神经网络模型 Siamese-Networks 快速复现

Siamese-Networks模型快速复现01 模型详情模型简介:在本文中,我们探索了一种学习孪生神经网络的方法,该方法采用独特的结构对输入之间的相似性进行自然排序。 一旦网络经过调整,我们就可以利用强大的判别特征来将网络的预测能力推广到新数据,以及来自未知分布的全新类别。 使用卷积架构,我们能够获得超过其他深度学习模型的强大结果,在一次性分类任务上具有接近最先进的性能。关键词:孪生神经网络学习、卷积架构应用场景:文本分类、文本分类结构:论文地址:ht.
原创
发布博客 2022.04.25 ·
135 阅读 ·
0 点赞 ·
0 评论

【AI周报】英伟达用AI设计芯片;不完美的Transformer要克服自注意力的理论缺陷

01 行业大事件几个GPU工作数天≈10人团队工作大半年英伟达用AI高效设计芯片「同样是移植一个新的技术库,如果使用人力,我们需要一个 10 人左右的团队工作大半年,但借助 AI,我们只需要花几天时间运行几个 GPU 就能完成大部分工作。」近几年,芯片设计成为 AI 落地的一个重要领域,谷歌、英伟达、三星、西门子等多家公司都已经计划或开始尝试在芯片设计中使用 AI。其中,同时在芯片设计和 AI 领域深耕多年的英伟达有着得天独厚的优势。在前段时间的 GTC 大会上,英伟达首席科学家..
原创
发布博客 2022.04.22 ·
914 阅读 ·
0 点赞 ·
0 评论
加载更多