2018年05月_syp_net

05月

原创 NLP中的常用工具

在这里，我要史上最全目录 %用 [TOC]来生成目录：目录 Hanlp 在Python环境中安装、介绍及使用 Stanford NLP 在Python环境中安装、介绍及使用快捷键 Markdown及扩展表格定义列表代码块脚注数学公式 UML 图: 离线写博客浏览器兼容 Hanlp 在Python环境中安装、介绍及使用本Markdown编...

2018-05-18 22:16:29 972

原创基于TF-IDF挖掘符合语言规范的N-GRAM

基于TF-IDF挖掘符合语言规范的N-GRAM 本Markdown编辑器使用StackEdit修改而来，用它写博客，将会带来全新的体验哦： Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传 LaTex数学公式 UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl ...

2018-05-18 14:51:31 1012

中国地大等《深度生成模型的对抗性攻击》综述全面阐述

深度生成模型因其为各种应用生成数据的能力而备受关注，这些应用包括医疗保健、金融技术、监控等，其中最受欢迎的模型是生成对抗网络和变分自动编码器。然而，与所有机器学习模型一样，人们一直担心安全漏洞和隐私泄露，深度生成模型也不例外。

2021-12-06

莫纳什大学最新「医学视觉问答」综述论文

医学视觉问答(VQA)是医学人工智能和流行的VQA挑战的结合。用自然语言给出医学图像和临床相关问题，期望医学VQA系统能够给出一个可信的、令人信服的答案。虽然一般领域的VQA已经得到了广泛的研究，但医学VQA由于其任务特点，还需要具体的研究和探索。

2021-11-29

多模态学习综述及最新方向

人类通过多种感觉器官接触世界，例如眼睛、耳朵、触觉。多模态机器学习(Multimodal Machine Learning)研究包含不同模态数据的机器学习问题。常见的模态包括：视觉、文字、声音。

2021-11-29

检索式聊天机器人技术综述

随着自然语言处理技术的飞速发展以及互联网上对话语料的不断积累,闲聊导向对话系统(简称聊天机器人)取得了令人瞩目的进展,受到了学术界的广泛关注,并在产业界进行了初步的尝试。

2021-11-28

Deakin最新《联邦学习智慧医疗》综述

通信技术和医疗物联网的最新进展改变了由人工智能(AI)实现的智能医疗。传统上，人工智能技术需要集中的数据收集和处理，但由于现代医疗网络的高度可扩展性和日益增长的数据隐私问题，这在现实的医疗场景中可能不可行。联邦学习(FL)是一种新兴的分布式协同人工智能范式，通过协调多个客户(如医院)在不共享原始数据的情况下进行人工智能训练，对智能医疗保健特别有吸引力。

2021-11-28

对话推荐算法研究综述（发表自软件学报）

推荐系统是一种通过理解用户的兴趣和偏好帮助用户过滤大量无效信息并获取感兴趣的信息或者物品的信息过滤系统.目前主流的推荐系统主要基于离线的、历史的用户数据，不断训练和优化线下模型，继而为在线的用户推荐物品，这类训练方式主要存在三个问题：基于稀疏且具有噪声的历史数据估计用户偏好的不可靠估计、对影响用户行为的在线上下文环境因素的忽略和默认用户清楚自身偏好的不可靠假设.

2021-11-26

面向行人重识别的局部特征研究进展、挑战与展望

行人重识别(Person re-identification, Re-ID)旨在跨区域、跨场景的视频中实现行人的检索及跟踪, 其成果在智能监控、刑事侦查、反恐防暴等领域具有广阔的应用前景. 由于真实场景下的行人图像存在光照差异大、拍摄视角不统一、物体遮挡等问题, 导致从图像整体提取的全局特征易受无关因素的干扰, 识别精度不高.

2021-11-25

UCL& UC Berkeley最新《深度强化学习泛化性》综述

强化学习的泛化性一直是个被人诟病的问题。最近来自UCL& UC Berkeley的研究人员对《深度强化学习》做综述，阐述了当前深度学习强化学习的泛化性工作，进行了分类和讨论。

2021-11-22

知识驱动的推荐系统：现状与展望

个性化推荐系统能够根据用户的个性化偏好和需要，自动、快速、精准地为用户提供其所需的互联网资源，已成为当今大数据时代应用最广泛的信息检索系统，具有巨大的商业应用价值。近年来，随着互联网海量数据的激增，人工智能技术的快速发展与普及，以知识图谱为代表的大数据知识工程日益受到学界和业界的高度关注，也有力地推动推荐系统和个性化推荐技术也迈入到知识驱动与赋能的发展阶段。

2021-11-22

清华&南开最新「视觉注意力机制Attention」综述论文

注意力机制是深度学习方法的一个重要主题。清华大学计算机图形学团队和南开大学程明明教授团队、卡迪夫大学Ralph R. Martin教授合作，在ArXiv上发布关于计算机视觉中的注意力机制的综述文章[1]。该综述系统地介绍了注意力机制在计算机视觉领域中相关工作，并创建了一个仓库.

2021-11-22

混合增强视觉认知架构及其关键技术进展

智能视觉系统虽然在大规模信息的特征检测、提取与匹配等处理上具备一定优势，但是在深层次认知上仍存在不确定性和脆弱性，尤其是针对视觉感知基础上的视觉认知任务，相关数理逻辑和图像处理方法并未实现质的突破，智能算法难以取代人类执行较为复杂的理解、推理、决策和学习等操作。

2021-11-22

人脸合成技术综述（发表自计算机科学与探索）

人脸合成由于其应用与技术价值，是机器视觉领域的热点之一，而近年来深度学习的突破性进展使该领域吸引了更多关注。将该领域的研究分为四个子类：人脸身份合成、人脸动作合成、人脸属性合成与人脸生成，并系统地总结了这些子类的发展历程、现状，以及现有技术存在的问题。首先针对人脸身份合成，从图形学、数字图像处理与深度学习三个角度总结了各自的合成流程，对关键技术原理进行了详细的解释与分析。

2021-11-22

可视化与人工智能交叉研究综述

随着人工智能技术的突破性进展, 人工智能与可视化的交叉研究成为当前的研究热点之一, 为人工智能和大数据分析领域的若干核心难题提供了启发式的理论、方法和技术. 一方面, 人工智能技术的创新应用提升了可视化的分析效率, 拓展了分析功能, 为大数据可视分析提供了强有力的工具. 另一方面, 可视化技术增强了以深度学习为代表的人工智能的可解释性和交互性, 为可解释人工智能提供了可靠的技术基础.

2021-11-19

新加坡国立大学最新「大规模深度学习优化」综述论文

深度学习在人工智能的广泛应用中取得了可喜的成果。更大的数据集和模型总是产生更好的性能。然而，我们通常花更长的训练时间在更多的计算和通信上。

2021-11-19

面向任务型的对话系统研究进展

基于人工智能技术的人机对话系统在人机交互、智能助手、智能客服、问答咨询等多个领域应用日益广泛,这极大地促进了自然语言理解及生成、对话状态追踪和端到端的深度学习模型构建等相关理论与技术的发展,并成为目前工业界与学术界共同关注的研究热点之一。

2021-11-17

随着教育信息化程度的不断加深，以预测学生知识状态为目标的知识追踪正成为个性化教育中一项重要且富有挑战性的任务。知识追踪作为一项教育数据挖掘的时间序列任务，与深度学习模型强大的特征提取和建模能力相结合，在处理顺序任务时具有得天独厚的优势。为此，简要分析传统知识追踪模型的特点及局限性，以深度知识追踪发展历程为主线，总结基于循环神经网络、记忆增强神经网络、图神经网络的知识追踪模型及其改进模型，并对该领域的已有模型按照方法策略归类整理。

2021-11-15

FPGA加速深度学习综述

近年来，由于互联网的高速发展和大数据时代的来临，人工智能随之大热，而推动人工智能迅猛发展的正是深度学习的崛起。大数据时代需要迫切解决的问题是如何将极为复杂繁多的数据进行有效的分析使用，进而充分挖掘利用数据的价值并造福人类。

2021-11-13

AI+时尚：人工智能在时尚&服装行业的应用综述

这种结构化的基于任务的多标签时尚研究文章分类为研究人员提供了明确的研究方向，方便了他们访问相关研究，同时提高了研究的可视性。对于每项任务，都会提供一个时间图表，以分析历年的进度。此外，我们还提供了86个公共fashion数据集的列表，以及建议的应用程序列表和每个应用程序的附加信息。

2021-11-06

蒙特利尔最新《自监督少样本目标检测》

标记数据通常是昂贵和耗时的，特别是对于目标检测和实例分割等任务，这需要密集的图像标记。虽然少样本目标检测是关于用很少的数据在新的(看不见的)目标类上训练模型，但它仍然需要在许多标记的基类(见)的示例上进行预训练。另一方面，自监督方法旨在从未标记的数据中学习表示，这些数据可以很好地转移到下游任务，如目标检测。将少样本和自监督目标检测相结合是一个很有前景的研究方向。

2021-10-30

网络社团发现新综述：从统计建模到深度学习

大量研究显示，复杂网络普遍具有一些显著的统计特性，比如小世界效应、无标度分布、网络弹性等。尤其是，Girvan 和 Newman 发现了复杂网络的另一个重要统计特性——社团结构，即网络通常会由一些稠密相连的结点簇组成。自此，学术界掀起了对复杂网络社团结构的研究热潮。

2021-10-28

编码计算研究综述（发表于《计算机研究与发展》）

编码计算将编码理论融于分布式计算中，利用灵活多样的编码方式降低数据洗牌造成的高通信负载，缓解掉队节点导致的计算延迟，有效提升分布式计算系统的整体性能，并通过纠错机制和数据掩藏等技术为分布式计算系统提供安全保障.鉴于其在通信、存储和计算复杂度等方面的优势，受到学术界的广泛关注。

2021-10-28

深度神经网络自监督视觉特征学习综述

为了在计算机视觉应用中学习得到更好的图像和视频特征，通常需要大规模的标记数据来训练深度神经网络。为了避免收集和标注大量的数据所需的巨大开销，作为无监督学习方法的一个子方法——自监督学习方法，可以在不使用任何人类标注的标签的情况下，从大规模无标记数据中学习图像和视频的一般性特征。

2021-10-25

轻量化神经网络卷积设计研究进展

传统神经网络具有过度依赖硬件资源和对应用设备性能要求较高的缺点，因此无法部署于算力有限的边缘设备和移动终端上，人工智能技术的应用发展在一定程度上受到了限制。然而，随着科技时代的到来，受用户需求影响的人工智能迫切需要在便携式设备上能成功进行如计算机视觉应用等方面的操作。

2021-10-25

安全多方计算及其在机器学习中的应用

随着人工智能、大数据等技术的发展，数据采集、数据分析等应用日渐普及，隐私泄露问题越来越严重.数据保护技术的缺乏限制了企业之间数据的互通，导致形成“数据孤岛”.

2021-10-21

基于表格数据的深度学习方法

近日，来自蒂宾根大学等机构的研究者进行了一项表格数据 SOTA 深度学习方法的调查研究。该研究首先将这些方法分为三组：数据转换、专用架构和正则化模型，然后全面概述了每个组中的主要方法。

2021-10-21

亚马逊最新《知识增强预训练语言模型》

预训练语言模型(Pretrained Language Models, PLM)通过在大规模文本语料库上学习信息语境化表示，建立了一种新的范式。这种新的范式已经彻底改变了整个自然语言处理领域，并为各种NLP任务设置了新的最先进的性能。然而，尽管PLM可以从训练语料库中存储一定的知识/事实，但它们的知识意识还远远不能令人满意。

2021-10-21

生物医学领域的预训练语言模型：系统综述

预训练语言模型已经成为大多数自然语言处理任务的事实范式。这也有利于生物医学领域：来自信息学、医学和计算机科学界的研究人员提出了各种在生物医学数据集上训练的预训练模型，如生物医学文本、电子健康记录、蛋白质和DNA序列，用于各种生物医学任务。

2021-10-19

区块链在供应链管理中的应用综述

供应链管理面临诸多挑战：保证产品信息的完整性、真实性和透明度；上下游企业之间的信任管理；企业交互过程中的隐私保护等等。而伴随区块链技术的问世，其为供应链的诸多挑战提供了完美的解决方案，但是依旧存在一些挑战。

2021-10-15

清华发布《国际科技创新中心指数2021》

近日，清华大学产业发展与环境治理研究中心联合自然科研（Nature Research），在2021中关村论坛全体大会上面向全球隆重发布国际科技创新中心指数2021（Global Innovation Hubs Index， GIHI）。报告通过科学中心、创新高地、创新生态等三大维度32个指标，对全球50个城市（都市圈）的创新能力进行测度。

2021-10-13

基于语言模型的预训练技术研究综述

预训练技术当前在自然语言处理领域占有举足轻重的位置。尤其近两年提出的ELMo、GTP、BERT、XLNet、T5、GTP-3等预训练模型的成功,进一步将预训练技术推向了研究高潮。该文从语言模型、特征抽取器、上下文表征、词表征四个方面对现存的主要预训练技术进行了分析和分类,并分析了当前自然语言处理中的预训练技术面临的主要问题和发展趋势。

2021-10-12

悉尼科技操龙兵教授《金融人工智能》综述

金融AI泛指人工智能技术在金融业务中的应用。几十年来，随着经典和现代人工智能技术被应用到金融、经济和社会等越来越广泛的领域，这一领域一直备受关注。与讨论特定人工智能技术，特别是新一代人工智能和数据科学(AIDS)领域所带来的金融问题、方面和机遇，或回顾应用特定技术解决特定金融问题的进展相比，这篇综述提供了一个全面而密集的路线图，概述了过去几十年金融领域人工智能研究面临的巨大挑战、技术和机遇。

2021-10-10

知识库问答系统研究进展

近年来，涌现了很多高质量大规模的知识库，基于知识库的问答系统（Knowledge Base Question Answering，KBQA）随着知识库的发展而得到了快速发展.知识库问答系统通过对自然语言问句进行理解和解析，进而利用知识库中的事实来回答自然语言问题，使用户在不了解知识库数据结构的情况下快速、精准的得到有价值的知识或答案.

2021-10-07

清华最新《图神经网络推荐系统》综述论文

推荐系统是当今互联网上最重要的信息服务之一。近年来，图神经网络已成为推荐系统的新技术。在这个调研中，我们对基于图神经网络的推荐系统的文献进行了全面的回顾。我们首先介绍了推荐系统和图神经网络的背景和发展历史。对于推荐系统，一般来说，现有工作的分类分为四个方面: 阶段、场景、目标和应用。对于图神经网络，现有的方法包括谱模型和空间模型两大类。

2021-10-07

NLPer，是时候重视因果推理了！

科学研究的一个基本目标是了解因果关系。然而，尽管因果在生活和社会科学中扮演了重要角色，它在 NLP 中却没有得到同样重要的地位，后者通常更加重视预测任务。随着因果推理和语言处理交叉研究领域的出现，二者之前的界限正变得模糊，但 NLP 中的因果推理研究仍然分散在各个领域，没有统一的定义、基准数据集和对剩余挑战的清晰表述。

2021-10-06

区块链数据隐私保护研究现状与展望

区块链作为一种分布式账本，集成了分布式共识、对等(peer to peer, P2P)网络、智能合约及密码学等技术，解决了“去中心化”的信任问题.区块链凭借其不可篡改、去中心化等特性，对社会各个领域产生了深远影响，掀起了区块链技术的研究与应用热潮.区块链技术应用场景十分广泛，其独特优势能够解决许多行业中的痛点.

2021-09-30

复旦大学邱锡鹏等《自然语言处理范式迁移综述》论文

在深度学习时代，大多数NLP任务的建模已经趋同于几种主流范式。例如，我们通常采用序列标注范式来解决POS-tagging、NER、Chunking等大量任务，而采用分类范式来解决情感分析等任务。

2021-09-30

物联网安全研究综述：威胁、检测与防御

基于近5年网安国际会议（ACM CCS、USENIX Security、NDSS、IEEE S＆amp;P）中发表的物联网安全文献，以及其他部分高水平研究工作，从威胁、检测、防御的视角对物联网安全研究工作进行了系统的整理和分析。

2021-09-30

知识感知的预训练语言模型综述

随着自然语言处理（NLP）领域中预训练技术的快速发展，将外部知识引入到预训练语言模型的知识驱动方法在NLP任务中表现优异，知识表示学习和预训练技术为知识融合的预训练方法提供了理论依据。

2021-09-26

多尺度变换像素级医学图像融合：研究进展、应用和挑战

基于多尺度变换的像素级图像融合是计算机视觉领域的研究热点，广泛应用于医学图像处理等领域。本文对多尺度变换的像素级图像融合进行综述，阐述多尺度变换图像融合的基本原理和框架。在多尺度分解方面，以时间为序梳理了塔式分解、小波变换和多尺度几何分析方法的发展历程。

2021-09-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 NLP中的常用工具

原创 基于TF-IDF挖掘符合语言规范的N-GRAM

中国地大等《深度生成模型的对抗性攻击》综述全面阐述

莫纳什大学最新「医学视觉问答」综述论文

多模态学习综述及最新方向

检索式聊天机器人技术综述

Deakin最新《联邦学习智慧医疗》综述

对话推荐算法研究综述（发表自软件学报）

面向行人重识别的局部特征研究进展、挑战与展望

UCL& UC Berkeley最新《深度强化学习泛化性》综述

知识驱动的推荐系统：现状与展望

清华&南开最新「视觉注意力机制Attention」综述论文

混合增强视觉认知架构及其关键技术进展

人脸合成技术综述（发表自计算机科学与探索）

可视化与人工智能交叉研究综述

新加坡国立大学最新「大规模深度学习优化」综述论文

面向任务型的对话系统研究进展

深度学习驱动的知识追踪研究进展综述

FPGA加速深度学习综述

AI+时尚：人工智能在时尚&服装行业的应用综述

蒙特利尔最新《自监督少样本目标检测》

网络社团发现新综述：从统计建模到深度学习

编码计算研究综述（发表于《计算机研究与发展》）

深度神经网络自监督视觉特征学习综述

轻量化神经网络卷积设计研究进展

安全多方计算及其在机器学习中的应用

基于表格数据的深度学习方法

亚马逊最新《知识增强预训练语言模型》

生物医学领域的预训练语言模型：系统综述

区块链在供应链管理中的应用综述

清华发布《国际科技创新中心指数2021》

基于语言模型的预训练技术研究综述

悉尼科技操龙兵教授《金融人工智能》综述

知识库问答系统研究进展

清华最新《图神经网络推荐系统》综述论文

NLPer，是时候重视因果推理了！

区块链数据隐私保护 研究现状与展望

复旦大学邱锡鹏等《自然语言处理范式迁移综述》论文

物联网安全研究综述：威胁、检测与防御

最新《计算机视觉持续学习进展》综述论文

知识感知的预训练语言模型综述

多尺度变换像素级医学图像融合：研究进展、应用和挑战

空空如也

原创基于TF-IDF挖掘符合语言规范的N-GRAM

区块链数据隐私保护研究现状与展望