- 论文篇 -
文章平均质量分 93
关于学习的所有论文,以及各方向论文分类。
夏天|여름이다
人工智能研究员,致力于计算机视觉,自然语言处理,语音处理,多模态模型,强化学习等相关研究。
展开
-
TTS | 一文总览语音合成系列基础知识及简要介绍
Text-to-Speech(通常缩写为TTS)是指一种将文本读成音频的技术。换句话说,它指的是一种模型,在该模型中,当文本或类似于字符的东西作为输入时,会生成波形音频作为输出。但实际上,这个 TTS 的音频质量在最近几年有了很大的提高。现在不那么尴尬了。整体内容结构遵循[Tan21],并添加了迄今为止(2022年8月)发表的最新论文。1.历史第一台“会说话的机器”可能是在 18 世纪后期制造的(据说是一位匈牙利科学家发明的)。计算机辅助创作起源于20世纪中叶,各种技术已经使用了大约50年。原创 2023-10-25 12:23:05 · 5129 阅读 · 2 评论 -
NLP | XLNet :用于语言理解的广义自回归预训练 论文详解
XLNet使用了一种排列的自回归预训练方法。原创 2022-11-09 22:18:26 · 800 阅读 · 0 评论 -
论文篇 | 基于深度学习的机器翻译论文总汇
长期以来,人们一直认为人类翻译的质量对于计算机翻译系统来说是无法实现的。在这项研究中,我们提出了一个深度学习系统CUBBITT,它挑战了这一观点。在人类法官的上下文感知盲测评估中,CUBBITT在保留文本含义(翻译充分性)方面显着优于专业机构的英语到捷克语新闻翻译。虽然人工翻译仍然被评为更流畅,但CUBBIT被证明比以前最先进的系统更流畅。此外,翻译图灵测试的大多数参与者都很难将CUBBITT翻译与人工翻译区分开来。这项工作接近人工翻译的质量,甚至在某些情况下充分超越了它。原创 2022-10-25 01:41:57 · 3256 阅读 · 0 评论 -
NLP | 自然语言处理经典seq2seq网络BERT详解及代码
BERT 是 Transformers 双向编码器表示的缩写,是一种用于自然语言处理的机器学习 (ML) 模型。它由 Google AI Language 的研究人员于 2018 年开发,是 11 种以上最常见语言任务的瑞士军刀解决方案,例如情感分析和命名实体识别。从历史上看,计算机很难“理解”语言。当然,计算机可以收集、存储和读取文本输入,但它们缺乏基本的语言上下文。因此,出现了自然语言处理 (NLP):人工智能领域,旨在让计算机从文本和口语中读取、分析、解释和获取含义。原创 2022-10-23 19:23:08 · 977 阅读 · 0 评论 -
论文篇 | 2020-Facebook-DETR :利用Transformers端到端的目标检测=>翻译及理解(持续更新中)
我们提出了一种将对象检测视为直接集合预测问题的新方法。我们的方法简化了检测方式,有效地消除了对许多手工设计的组件的需求,例如非最大抑制过程或锚点生成,这些组件明确地编码了我们关于任务的先前知识。新框架的主要成分称为DEtection TRansformer或DETR,是基于集合的全局损耗,通过二分匹配强制进行独特的预测,以及transformer编码器 - 解码器架构。给定一组固定的学习对象查询,DETR 推理对象和全局图像上下文的关系,以直接并行输出最终的预测集。原创 2022-09-11 22:45:46 · 2056 阅读 · 0 评论 -
学术 | 一文了解计算机视觉会议(顶级会议),申请要求及论文LaTeX排版
ICCV的全称是IEEEInternationalConferenceonComputerVision,即国际计算机视觉大会,是公认的三个会议中级别最高的。它的举办地方会在世界范围内选,每两年召开一次(奇数年份)。dblpICCVECCV的全称是EuropeanConferenceonComputerVision,即欧洲计算机视觉国际会议。每两年召开一次,与ICCV正好错开(偶数年份)。ECCV官网提交网站ECCV2020的提交网站是OpenReview(不是CMT)。%......原创 2022-07-24 18:23:00 · 7482 阅读 · 0 评论 -
资源类❀超实用学术必备的论文学习网站和英文论文编写,人工智能学习网站(免费)
可以查看自己方向最好的排名论文和代码,还有SOTA。网址:The latest in Machine Learning | Papers With Code点到自己关心的论文粗略读文章时,建议下载google的翻译插件,如果英文不好的话,可以整个页面翻译。 有计算机视觉,nlp,医学分割,知识库,视觉推理,对抗性网络,还有各种迁移学习。......原创 2022-06-15 19:05:59 · 1436 阅读 · 0 评论 -
❀论文篇❀一文了解基于计算机视觉的自动驾驶(Autonomous Driving)子任务算法研究综述
我们应该如何整合来自互补传感器的表示以用于自动驾驶?基于几何的融合已经显示出感知的前景(例如对象检测、运动预测)。然而,在端到端驾驶的背景下,我们发现基于现有传感器融合方法的模仿学习在具有高密度动态代理的复杂驾驶场景中表现不佳。因此,我们提出了TransFuser,这是一种使用自注意力集成图像和LiDAR表示的机制。我们的方法使用多种分辨率的变压器模块来融合透视图和鸟瞰图特征图。我们在具有挑战性的新基准(具有长路线和密集交通)以及CARLA城市驾驶模拟器的官方排行榜上通过实验验证其功效。在提交时,Tran。原创 2022-07-19 15:04:04 · 1425 阅读 · 2 评论 -
❀论文篇❀EmotiCon: Context-Aware Multimodal Emotion Recognition using Frege’s Principle论文翻译
情绪识别论文:EmotiCon: Context-Aware Multimodal Emotion Recognition using Frege’s Principle论文地址:https://arxiv.org/pdf/2003.06692.pdf目录摘要Abstract1. 介绍Introduction2. 相关工作Related Work2.1. 多模态情绪识别Uni/Multimodal Emotion Recognition2.2. 心理学研究中的情景感知情绪识别Context-Aware Em原创 2022-06-22 20:53:09 · 1774 阅读 · 0 评论 -
❀论文篇❀注意力机制SE论文的理解
注意力机制SE的通俗理解!❤❤❤原创 2022-06-03 06:33:53 · 3010 阅读 · 0 评论 -
❀论文篇❀lightweightnetwork轻量级网络论文速览,持续更新中。。。
MobileNet系列2017MobileNet论文地址:[1704.04861] MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications (arxiv.org)项目地址:tensorflow框架Zehaos/MobileNet: MobileNet build with Tensorflow (github.com)MobileNetV2论文地址:[1801.0438.原创 2022-06-01 23:55:28 · 710 阅读 · 0 评论 -
❀论文篇❀Context Based Emotion Recognition Using EMOTIC Dataset论文翻译
基于上下文的情景感知论文。原创 2022-06-01 16:21:27 · 1796 阅读 · 1 评论 -
论文篇 | 2010-2023,万字情绪识别(EmotionRecognition)论文总结【20231016更新】
情绪识别目前我所了解的有,基于人脸的情绪识别,基于声音的情绪识别,基于身体特征的情绪识别,基于脑电波的情绪识别,基于时空的情绪识别等。这篇博客主要是人脸表情/情绪识别(Face expression recognition/Face emotion recognition)/一般人脸情绪识别我自己把它分为image FER和 tensor FER 。有的虽然是实时检测人脸识别,因为输入是图片(image),如果输入的是视频为基础,或者带时间维度参数则属于动态人脸情绪识别。(仅表达自己分类标准,有问题可以原创 2022-04-05 19:56:50 · 6070 阅读 · 2 评论