自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(134)
  • 收藏
  • 关注

原创 【AI周报】AI与冷冻电镜揭示「原子级」NPC结构;清华、商汤提出「SIM」方法兼顾语义对齐与空间分辨能力

施一公等团队登Science封面:AI与冷冻电镜揭示「原子级」NPC结构,生命科学突破今日,《Science》杂志以封面专题的形式发表了 5 篇论文,共同展现了通过 AI 技术来揭示人类和非洲爪蟾的核孔复合体(NPC)结构。开始正文之前,我们先来看一张图片,在下图中,很明显可以看出,图的右半部分所代表的信息更加丰富,结构也更清晰。而左半部分 2016 年的图,则结构较为单一,代表的信息比较少:其实上面展示的是核孔复合体(NPC)图像。核孔复合体,由约 1000 个蛋白质亚基组成,担负着真核生物细胞核与细胞质

2022-06-10 18:24:59 622 2

原创 深度学习基础篇【4】从0开始搭建EasyOCR并进行简单文字识别

所谓OCR,全称为“Optical Character Recognition”,即光学字符识别。简单来讲,它就是实现对文本资料的图像文件进行分析识别处理,以获取其中文字及版面信息的技术。 - 语言环境:Python3.7- 编译器:jupyter notebook- 深度学习环境:pytorch 1.6- 深度学习平台:极链AI云- 显卡(GPU):NVIDIA RTX 2080Ti 目录 01 实例创建 02 准备工作 03 数据预处理 04 构建模型 05 编

2022-06-10 15:18:08 1970

原创 人工智能行业现状与未来发展趋势

在新科技革命和产业变革的大背景下,人工智能与产业深度融合,是释放数宇化查加倍增效应,加快战略新兴产业发展,构筑综合克争优势的必然选择。当前,人工智能加快向各产业渗透,正在促进新兴产业之间.新兴产业与传统产业之同以及技术与社会的跨界融合发展。在“十四五”开端,全面梳理人工智能的发展态势,具有十分重要的参专意义。本文结合中国信息通信研究院发布的《人工智能白皮书(2022)》,对当下国内的人工智能行业现状与未来发展趋势进行探究。第一:智能化是未来的重要趋势之一。关注互联网的发展,大数据、云计算和物联网等相关技术会

2022-06-08 18:24:01 17824

原创 【模型解析】从V1-V5深入解析YOLO系列模型

从V1-V5深入解析YOLO系列模型yolo相对于R_CNN系列论文,创新之处在于不再需要候选区域,直接端到端,利用回归的思想,直接回归出边框和类别,大大加快了速度,同时精度也挺高。YOLO v1 主要思想1、将图片划分为s×s的网格,待检测的目标中心点位于哪个网格中,就由哪个网格来负责检测他,论文中每个网格设定了2个框,也就是让2个框来同时拟合一个目标框,所以当网格中存在目标时,那么该网格中的预测框的目标值即为这个目标框的值(对比R_CNN系列论文,他们都是通过预测框与目标框的IOU来设定预测框的目标值)

2022-06-06 18:35:36 2557

原创 【AI周报】首款高容错通用量子计算机原型登上Nature;SIGIR 2022 | 快手联合武汉大学提出序列推荐的多粒度神经模型

01# 行业大事件首款高容错通用量子计算机原型登上Nature理论上,量子计算机可以解决常规计算机在宇宙生命周期时间内也无法解决的问题。然而,我们需要大量的工程和技术才能将其「理论上」的能力兑现,制造出实用化的量子设备。首先,量子计算机必须能够克服自身对错误的脆弱性。在新研究中,研究人员已经成功开发出一种技术,可以用所谓「容错」的方式执行任何可能的量子计算。在经典计算机上,我们以晶体管的开启和关闭状态表示数据符号的 1 或 0,而量子计算机使用「量子比特」,由于量子物理层面上的特殊性质,它们可以存在 1 和

2022-06-05 01:08:38 260

原创 【竞赛分享】2022天池江苏气象AI算法挑战赛 思路分享 (初赛暂排第3)

赛题理解比赛任务为标准的时空预测问题,输入输出都为图片的序列。在本赛题中为输入过去20帧图片,预测未来20帧。每小时包含10帧数据,因此每个样本代表了4个小时时长的气象观测数据。赛题中的变量有三种:雷达、降水、风速。官网对数据描述如下。【气象雷达数据集】气象雷达数据集是雷达回波数据的时间序列,其物理含义为3公里等高面的基本反射率因子。大气中的水滴含量越高,则雷达基本反射率越高。本数据集是对江苏多部S波段气象雷达质量控制及组网拼图后得到的,覆盖整个江苏省区域面积。数据取值范围为0-70(单位:dBZ)

2022-06-01 17:57:17 2184 14

原创 【模型复现】文本匹配、文本分类模型Opennmt模型快速复现教程

Opennmt模型快速复现教程01模型详情模型简介:OpenNMT 是一个由 Harvard NLP (哈佛大学自然语言处理研究组) 开源的 Torch 神经网络机器翻译系统。简单的通用接口,只需要源/目标文件。快速高性能GPU训练和内存优化。提高翻译性能的最新的研究成果。可配对多种语言的预训练模型。允许其他序列生成任务的拓展,如汇总和图文生成。 机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一。关键词:

2022-06-01 17:52:43 412

原创 深度学习基础篇【5】从0开始搭建YOLOV5 并进行测试

深度学习基础篇【5】从0开始搭建YOLOV5并进行测试如何评价YOLO V5,那就必须拿“上一代”YOLO V4来做对照了。先说结论,YOLO V5 在性能上稍弱于YOLO V4,但是在灵活性与速度上远强于YOLO V4,在模型的快速部署上具有极强优势。在YOLOv3、YOLOv4中,训练不同的数据集时,计算初始锚框的值是通过单独的程序运行的。但YOLOv5中将此功能嵌入到代码中,每次训练时,自适应的计算不同训练集中最佳锚框找值。当然,如果计算锚框效果不是很好,也可以在代码中将西东.

2022-05-30 18:16:09 782

原创 【AI周报】科学家在类脑芯片上实现类似LSTM的功能,能效高1000倍;Meta加速ViT训练流程,吞吐量4倍提升

01# 行业大事件Nature子刊:科学家在类脑芯片上实现类似LSTM的功能,能效高1000倍格拉茨技术大学的计算机科学家在 Nature 子刊上发表的一篇论文表明,他们找到了一种在神经形态芯片上模拟 LSTM 的方案,可以让类脑神经形态芯片上的 AI 算法能效提高约 1000 倍。随着智能手机的普及,手机游戏也越来越受欢迎。但视频游戏等程序会大量耗电耗能。与 GPU 等标准硬件相比,基于 spike 的神经形态芯片有望实现更节能的深度神经网络(DNN)。但这需要我们理解...

2022-05-28 16:52:24 223

原创 深度学习基础篇【4】从0开始搭建YOLOR 并进行测试

深度学习基础篇【4】从0开始搭建YOLOR并进行测试YOLOR模型于2021年由开发者Chien-Yao Wang, I-Hau Yeh, Hong-Yuan Mark Liao在《You Only Learn One Representation: Unified Network for Multiple Tasks》提出。 人类可以从不同的角度可以分析相同的数据。然而,经过训练的卷积神经网络(CNN)模型通常只能实现一个目标,一般来说,从训练有素的CNN中提取的特征不适用于其他类型的问.

2022-05-28 16:09:28 616

转载 ACL 2022 | 腾讯QQ浏览器实验室提出文本语义匹配训练策略,与PLM结合效率不减

ACL 2022 |腾讯QQ浏览器实验室提出文本语义匹配训练策略,与PLM结合效率不减这篇ACL 2022研究提出了一个简单而有效的文本语义匹配的训练策略,通过分治的方式将关键词从意图中分离出来。作为国际最受关注的自然语言处理顶级会议,每年的 ACL 都吸引了大量华人学者投稿、参会。今年的 ACL 大会已是第 60 届,于 5 月 22-5 月 27 举办。受到疫情影响,国内 NLP 从业者参与大会受到很多限制。为了给国内 NLP 社区的从业人员搭建一个自由轻松的学术交流平台,...

2022-05-27 14:14:05 284

原创 【模型复现】文本匹配、文本分类模型ABSA快速复现

ABSA 模型快速复现教程01模型详情模型简介:这篇文章是Attention-based LSTM for Aspect-level Sentiment Classification,并且发表在EMNLP 2016 上, 作者为Yequan Wang。 基于属性的情感分析(Aspect Based Sentiment Analysis)是一种在给定的语料库中同时提取(co-extracting )表达意见和(事物)属性/方面术语(意见目标)以及它们之间的关系的任务。 方.

2022-05-25 15:01:10 570

原创 深度学习基础篇【3】从0开始搭建faster—rcnn并进行评估、训练

深度学习基础篇【3】从0开始搭建faster—rcnn并进行评估、训练Faster R-CNN可以简单地看做“区域生成网络RPNs + Fast R-CNN”的系统,用区域生成网络代替FastR-CNN中的Selective Search方法。Faster R-CNN这篇论文着重解决了这个系统中的三个问题:1. 如何设计区域生成网络;2. 如何训练区域生成网络;3. 如何让区域生成网络和Fast RCNN网络共享特征提取网络。 《Faster R-CNN: Towards Real-Time

2022-05-23 22:46:02 963

原创 【AI周报】TensorFlow 2.9上线;2022 IBM博士生奖学金揭晓:8位华人入选

01# 行业大事件TensorFlow 2.9上线:oneDNN改进实现CPU性能优化,WSL2开箱即用TensorFlow 2.9 已发布,还没有更新的小伙伴现在可以更新了。昨日,TensorFlow 官方宣布:TensorFlow 2.9 来了!距离上次2.8 版本的更新仅仅过去三个月。新版本亮点包括如下:oneDNN 的性能改进;DTensor 的发布,这是一种新 API,可用于从数据并行无缝迁移到模型并行;对核心库进行了改进,包括 Eigen...

2022-05-21 15:38:32 699 1

原创 【模型复现】文本分类、文本匹配模型——jointbert快速复现

JointBERT 模型快速复现教程01模型详情模型简介:《BERT for Joint Intent Classification and Slot Filling》是2019年2月的文章,Computation and Language会议。意图分类和插槽填充是自然语言理解的两个基本任务。他们经常受到小规模的人工标签训练数据的影响,导致泛化能力差,尤其是对于低频单词。最近,一种新的语言表示模型BERT (Bidirectional Encoder Represent.

2022-05-19 18:13:34 696

原创 深度学习基础篇【2】从0开始搭建Detectron2进行简单的图像识别

深度学习基础篇【1】从0开始搭建Detectron2进行简单的图像识别detectron2是facebook AI research(FAIR)重构detectron的深度学习框架,是2020年最火的深度学习框架(另外还有mmdetection,simpledet,目标检测三大开源神器:Detectron2/mmDetection/SimpleDet。detectron2从基于caffe重构为完全基于pytorch,集成了先进的目标检测和语义分割算法。本文搭建Detectron2,并

2022-05-19 18:11:47 507

转载 ACL2022奖项公布伯克利摘得最佳论文,陈丹琦、杨笛一等华人团队获杰出论文

ACL2022奖项公布伯克利摘得最佳论文,陈丹琦、杨笛一等华人团队获杰出论文刚刚,NLP 领域国际顶会 ACL2022 公布获奖论文信息,其中加州大学伯克利分校的增量句法表示研究被评为最佳论文。此外,最佳主题论文、杰出论文也揭晓。ACL 是计算语言学和自然语言处理领域的顶级国际会议,由国际计算语言学协会组织,每年举办一次。一直以来,ACL 在 NLP 领域的学术影响力都位列第一,它也是 CCF-A 类推荐会议。今年的 ACL 大会已是第 60 届,将于 5 月 22-5 月 27 在...

2022-05-18 15:52:04 922

原创 【模型复现】无监督文本匹配模型——SimCSE快速复现

SimCSE 模型快速复现教程01模型详情模型简介:SIMCSE是一种用于生成句子嵌入的对比学习框架。它利用了无监督的方法,该方法采用输入句,并以对比目标预测本身,只有标准dropout用作噪声。作者发现dropout行为是隐藏表示的最小“数据增强”,同时删除它导致表示崩溃。之后使用了监督方法将注释对从自然语言推理数据集中包含到对比框架中。关键词:无监督应用场景:文本匹配结构:论文地址:https://arxiv.org/abs/2104.0882..

2022-05-17 14:38:48 1787

原创 【AI周报】腾讯AI Lab等提出免训练跨模态文本生成框架;DeepMind「通才」AI智能体Gato来了

01行业大事件即插即用、无需训练:剑桥大学、腾讯AI Lab等提出免训练跨模态文本生成框架来自剑桥大学、腾讯AI Lab 等机构的研究者提出了一个全新的框架 MAGIC (iMAge-guided text GeneratIon with CLIP),MAGIC 通过直接插入可控图文匹配模型分数的方式,使得语言模型在解码过程中选择更接近图片信息的生成结果。本文提出了一个全新的 MAGIC (iMAge-guided text GeneratIon with CLIP)框架...

2022-05-13 18:19:45 573

原创 深度学习基础篇【1】从0开始搭建YOLOX模型用于训练个人数据集

深度学习基础篇【1】从0开始搭建YOLOX模型用于训练个人数据集YOLOX模型于2021年由开发者Zheng Ge,Songtao Liu,Feng Wang,Zeming Li,Jian Sun在《YOLOX: Exceeding YOLO Series in 2021》首次提出。 YOLOX对YOLO系列的进行一些改进,形成了一种新的高性能探测器。配备了一些新的先进检测技术,即解耦头、无锚点和先进的标签分配策略,YOLOX在速度和精度之间实现了更好的平衡,比所有型号尺寸的其他同类产品都好。值

2022-05-13 15:12:53 780

原创 【模型复现】逆合成预测/文本分类模型——MeGAN 快速复现

MeGAN快速复现教程01 镜像详情镜像简介:模型论文2021年5月发表在JCIM上的关于逆合成路线规划一篇文章,标题为《Molecule Edit Graph Attention Network:Modeling Chemical Reactions as Sequences of Graph Edits》,本文提出了分子编辑图注意网络(MEGAN),是一个端到端编码器-解码器神经模型。由于大部分的逆合成实验都是基于数据集USPTO50k以及USPTO-full进行的实验。为了

2022-05-11 16:33:19 602

转载 CVPR 2022 | 16万视频对、28万对片段,蚂蚁开源视频侵权检测超大数据集

CVPR 2022 | 16万视频对、28万对片段,蚂蚁开源视频侵权检测超大数据集• CVPR 2022 VCSL 论文:https://arxiv.org/abs/2203.02654•VCSL 数据集和评测以及算法代码:https://github.com/alipay/VCSL• 文章转载自:机器之心• 原文地址:https://www.jiqizhixin.com/articles/2022-05-09-4该研究提出了目前最大规模(超过现有其他数据集...

2022-05-10 14:49:10 370

原创 【模型复现】零样本预测文本分类模型——ESM 快速复现模型

ESM快速复现教程01 镜像详情镜像简介:这篇论文《Biological structure and function emerge from scaling unsupervised learning to 250 million protein sequences》 .是2019年2月的文章,发布在biorxiv上。代码中包括来自 Facebook AI Research 的 Transformer 蛋白质语言模型的代码和预训练权重,包括我们最先进的 ESM-1b 和 MSA T

2022-05-09 15:52:53 1781

原创 极链AI云升级公告

2022年5月6日极链AI云全新升级。这次升级包括网络带宽的扩容和产品性能的提升。升级后,您能感受到更加流畅的实例操作体验以及更加高效的文件传输和读取速度。同时,平台为回馈用户的一路陪伴,推出了性价比超高的租赁服务。例如热门的RTX3080,由4元/小时降至3.3元/小时,用单卡进行一天的模型训练直接能省出一杯奶茶钱!同时平台还在陆续上架A100,P40等多种机型,满足你的各种机器需求。如果你是学生,更有额外的100元云币券和95折租赁优惠~接下来,让我们具体看看这次全新升级,到底能给用户带来什么.

2022-05-08 12:53:42 704

原创 【AI周报】谷歌、Meta如何给大模型瘦身?;Meta开放1750亿参数大模型,媲美GPT-3

01 行业大事件谷歌、Meta如何给大模型瘦身?谷歌工程师亲述部署秘籍(免费书)这是一本正在写作的新书,目前前四章已经放出了草稿。过去几年,GPT-3 等几个大模型展示了大数据、大算力的力量,它们的效果毋庸置疑,但在现实世界中训练和部署这些模型是非常昂贵的,这阻碍了大模型在现实世界中的广泛应用,比如很多效果很好的大模型根本无法在手机上运行。因此,我们需要想办法把模型做得更加高效(在尽量不损失性能的前提下把模型做得更小)。那么,具体该怎么做呢?为了解答这个问题,谷歌机器学习..

2022-05-08 12:41:30 316

原创 【模型复现】高精度文本匹配/分类模型——consert快速复现

ConSERT快速复现教程01 镜像详情镜像简介:Consert是由2021年的论文《A Contrastive Framework for Self-Supervised Sentence Representation Transfer》提出,现在在深度学习网络中应用越来越广泛。 为解决 BERT原生句子表示这种“坍缩”现象,美团NLP中心知识图谱团队提出了基于对比学习的句子表示迁移方法—— ConSERT,通过在目标领域的无监督语料上Fine-tune,使模型生成的句子表示与下游

2022-05-07 19:13:54 697

转载 ViT的复仇:Meta AI提出ViT训练的全新baseline

ViT的复仇:Meta AI提出ViT训练的全新baseline• 论文链接:https://arxiv.org/pdf/2204.07118.pdf• 文章转载自:机器之心• 原文地址:https://www.jiqizhixin.com/articles/2022-05-03-3本文提出了训练视觉 Transformer(ViT)的三种数据增强方法:灰度、过度曝光、高斯模糊,以及一种简单的随机修剪方法 (SRC)。实验结果表明,这些新方法在效果上大大优于 ViT 此前的全监督..

2022-05-07 15:42:32 182

转载 ACL 2022复旦、字节等推出首个可解释类比推理数据集,中英双语

ACL 2022复旦、字节等推出首个可解释类比推理数据集,中英双语A bench mark forrationalizing natural language analogical reaoning• 论文链接:https://arxiv.org/abs/2203.08480• 项目主页:https://ekar-leaderboard.github.io文章转载自:机器之心来自复旦大学、字节跳动人工智能实验室等机构的研究者提出E-KAR 数据集,这是首个可解释的知识密集..

2022-05-06 19:52:48 163

原创 【模型复现】深度可分离卷积/逆残差结构模型——MobileNetV3快速复现

MobileNetV3快速复现教程01 镜像详情镜像简介:这个模型的文章是由Andrew Howard团队发表在ICCV 2019 上的。文章综合了MobileNetV1的深度可分离卷积(depthwise separable convolutions)和MobileNetV2的具有线性瓶颈的逆残差结构(the inverted residual with linear bottleneck)。首先使用 MnasNet 进行粗略结构的搜索,然后使用强化学习从一组离散的选择中选择最优配

2022-05-05 19:11:13 2527

原创 【极链AI云5月6日更新公告】

亲爱的用户:极链AI云作为极链科技集团下属专为AI科研与学习而设计的AI一站式开发平台。自上线之初就备受用户好评。在经历诸多重大更新与调整后,平台现已拥有60个经典模型,65个热门数据集,可通过简单步骤实现快速复现。为用户操作带来极大便利。为了给用户带来更好的使用体验,平台将于5月6日进行全面升级,本次升级将有效解决实例卡顿问题、提升文件传输速度、大幅提高/user-data读写速度。同时,我们也将推出性价比更高的机器。平台在升级后,4K 异步写入速度可达30k iops,单文件异步写入速度

2022-05-02 00:26:14 435

原创 【AI周报】国产框架OneFlow兼容PyTorch,25倍性能加速;DeepMind新型800亿模型表现优秀

01 行业大事件兼容PyTorch,25倍性能加速,国产框架OneFlow「超速」了要想炼丹爽得飞起,就要选择一个顺手的炉子。作为 AI 工程师日常必不可缺的「炼丹炉」,「PyTorch 还是TensorFlow?」已成为知乎、Reddit 等炼丹师出没之地每年都会讨论的热门话题。业界流传一种说法:PyTorch 适合学术界,TensorFlow适合工业界。毕竟,PyTorch 是用户最喜欢的框架,API 非常友好,Eager 模式让模型搭建和调试过程变得更加容易,不过,它的静态...

2022-04-30 18:35:21 810

转载 MGO-GAN:利用正交向量缓解GAN训练时模式崩溃的问题

MGO-GAN:利用正交向量缓解GAN训练时模式崩溃的问题Tackling mode collapse in multi-generator GANs with orthogonal vectors论文地址:https://www.sciencedirect.com/science/article/abs/pii/S0031320320304490#section-cited-by本文转发自知乎作者: 记忆的迷谷本文《Tackling mode collapse in multi-g..

2022-04-29 19:29:11 422

转载 CVPR 2022 | 高质量捕捉人物动作,网易互娱AI Lab提出高效视频动捕技术

CVPR 2022 | 高质量捕捉人物动作,网易互娱AI Lab提出高效视频动捕技术Spatial-Temporal Parallel Transformer for Arm-Hand Dynamic Estimation原文地址:CVPR 2022 | 高质量捕捉人物动作,网易互娱AI Lab提出高效视频动捕技术 | 机器之心转发自:机器之心论文地址:https://arxiv.org/pdf/2203.16202.pdfiCap是网易互娱AI Lab研发的一款产品级的视觉动.

2022-04-28 17:54:06 982

原创 【模型复现】卷积网络目标检测模型——UNet 快速复现

UNet 模型快速复现教程01 模型详情模型简介:这篇论文《UNet++: A Nested U-Net Architecture for Medical Image Segmentation》是2018年6月的文章,DLMIA2018会议。文章对Unet改进的点主要是skip connection。UNET利用卷积网络的典型利用是在分类任务,输出任务的单个类标签。然而,在许多视觉任务,尤其是生物医学图像处理,目标输出应该包括定位等,每个像素都应该有类标签。另外,大量的训练图片往往.

2022-04-27 19:25:45 3111

原创 【模型复现】孪生神经网络模型 Siamese-Networks 快速复现

Siamese-Networks模型快速复现01 模型详情模型简介:在本文中,我们探索了一种学习孪生神经网络的方法,该方法采用独特的结构对输入之间的相似性进行自然排序。 一旦网络经过调整,我们就可以利用强大的判别特征来将网络的预测能力推广到新数据,以及来自未知分布的全新类别。 使用卷积架构,我们能够获得超过其他深度学习模型的强大结果,在一次性分类任务上具有接近最先进的性能。关键词:孪生神经网络学习、卷积架构应用场景:文本分类、文本分类结构:论文地址:ht.

2022-04-25 18:19:12 963

原创 【AI周报】英伟达用AI设计芯片;不完美的Transformer要克服自注意力的理论缺陷

01 行业大事件几个GPU工作数天≈10人团队工作大半年英伟达用AI高效设计芯片「同样是移植一个新的技术库,如果使用人力,我们需要一个 10 人左右的团队工作大半年,但借助 AI,我们只需要花几天时间运行几个 GPU 就能完成大部分工作。」近几年,芯片设计成为 AI 落地的一个重要领域,谷歌、英伟达、三星、西门子等多家公司都已经计划或开始尝试在芯片设计中使用 AI。其中,同时在芯片设计和 AI 领域深耕多年的英伟达有着得天独厚的优势。在前段时间的 GTC 大会上,英伟达首席科学家..

2022-04-22 19:07:58 1424

原创 CVPR 2022 优质论文分享

CVPR 2022 优质论文分享A ConvNet for the 2020s论文:https://arxiv.org/abs/2201.0354代码:https://github.com/facebookresearch/ConvNeXt2020年以来,ViT一直是研究热点。ViT在图片分类上的性能超过卷积网络的性能,后续发展而来的各种变体将ViT发扬光大(如Swin-T,CSwin-T等),值得一提的是Swin-T中的滑窗操作类似于卷积操作,降低了运算复杂度,使得ViT可..

2022-04-22 19:03:41 5097

原创 【模型复现】目标检测模型——​EfficientDet 快速复现教程

01 模型详情模型简介:《EfficientDet: Scalable and Efficient Object Detection》论文发表于2020年7月由Mingxing Tan, Ruoming Pang, Quoc V. Le三人完成,EfficientDet是一种对象检测模型,它利用了若干优化和主干调整,例如使用BiFPN,以及一种复合缩放方法,该方法同时均匀缩放所有主干、特征网络和盒/类预测网络的分辨率、深度和宽度。关键词:对象检测、复合缩放应用场景:图像分割、目标..

2022-04-20 17:24:17 3889

原创 【镜像复现】开源围棋AI—— ikataGo 快速复现教程

iKataGo快速复现教程01 镜像详情镜像简介:极链AI云内置iKatago专用卡塔狗围棋AI服务器端,各种主流配置显卡V100、3080、2080ti单卡到8卡多种组合,创建实例一键启动调用无需任何手动配置,内置最新卡塔狗引擎,最强分先权重和让子权重,适合于广大棋友人机对弈,复盘分析,网络对战,围棋教学等各项工作。应用场景:围棋论文地址:https://arxiv.org/abs/1409.4842v102 平台环境准备1. 打开极链AI云平台..

2022-04-19 14:52:07 2084

原创 【AI周报】无需训练自动扩展的视觉Transformer来了;达摩院推出新型预训练对话模型,取得显著提升

01 # 行业大事件无需训练,自动扩展的视觉Transformer来了来自德克萨斯大学奥斯汀分校、悉尼科技大学和谷歌的研究者提出了一个无需训练就能自动扩展框架 As-ViT,其能以高效和有原则的方式自动发现和扩展 ViT。当前 Vision Transformers (ViT)领域有两个主要的痛点:1、缺少对 ViT 进行设计和扩展的有效方法;2、训练 ViT 的计算成本比卷积网络要大得多。为了解决这两个问题,来自得克萨斯大学奥斯汀分校、悉尼科技大学和谷歌的研究者提出了 As-V..

2022-04-15 18:40:37 1746

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除