mishidemudong-CSDN博客

转载快速神经网络的训练算法LARS/LAMB工作原理 --UC Berkeley在读博士生尤洋

快速神经网络的训练算法 --UC Berkeley博士尤洋快速神经网络的训练算法 --UC Berkeley博士尤洋为什么深度学习很慢？如果我们利用并行计算，怎样才能完美的利用大量的processor？为什么large batch size会引起精度降低？新优化器参考：快速神经网络的训练算法 --UC Berkeley博士尤洋本片文章介绍的两种算法不仅可以优化并行计算，在普通硬件环境中运行也是有效的。算法是由UC Berkeley博士尤洋开发。在固定精度的情况下，新算法可以更快的达到要求

2021-04-10 16:37:08 496

转载 ###好好好####知识图谱如何应用到文本标签化算法中

前言丁香园和丁香医生业务中存在着大量的文章，帖子，公开问题等文本数据，采用简单的分词或者词典匹配的方法得到的关键词，在推荐和搜索场景中容易遇到准确性低下的情况。文本的标签生成是NLP领域的一项基础任务，目的是对文本更好地结构化，筛选重要的关键词，概括文本的中心语义。因此，我们探索了一套标签生成流程，其中除了应用了已有的信息抽取技术之外，还将医疗知识图谱结构，实体显著性判断，concept抽取融入模型，实现业务增长。关于标签生成，优化的方法大致有两种思路，第一种是在拥有一个较为完备的知识图谱后，如何使

2021-04-08 14:39:50 606

转载文本生成12：4种融合知识的text generation

刘知远老师曾经讲过“NLP搞事情少不了知识指导”。研究深度学习和知识如何更有效的结合成了越来越多人关注的课题了。本文尝试从文本生成的角度，对融合知识的idea做了一个简单的汇总，大致有4个较为典型的方式：多任务学习（生成+文本蕴含）基于knowledge graph 的文本生成基于memory network 的文本生成结合分布-采样进行文本生成需要提醒的是，这篇博客没有涵盖问答、对话和阅读理解等本身就以“知识”和“逻辑”为重的文本生成任务；此外我的学习笔记仅仅是抛砖引玉，很欢迎大

2021-04-05 17:56:09 1271

转载 KDD 2020 | 会话推荐系统新进展：基于互信息最大化的多知识图谱语义融合

论文标题： Improving Conversational Recommender Systems via Knowledge Graph based Semantic Fusion论文来源： ACM SIGKDD 2020论文链接： https://arxiv.org/abs/2007.04032会话推荐系统(conversation recommender system, CRS)旨在通过交互式的会话给用户推荐高质量的商品。通常CRS由寻求商品的user和推荐商品的system组成，通..

2021-04-01 15:17:21 430

转载一文看懂NLP里的分词（中英文区别+3 大难点+3 种典型方法）

分词是 NLP 的基础任务，将句子，段落分解为字词单位，方便后续的处理的分析。本文将介绍分词的原因，中英文分词的3个区别，中文分词的3大难点，分词的3种典型方法。最后将介绍中文分词和英文分词常用的工具。什么是分词？分词是自然语言理解 – NLP 的重要步骤。分词就是将句子、段落、文章这种长文本，分解为以字词为单位的数据结构，方便后续的处理分析工作。为什么要分词？1.将复杂问题转化为数学问题在机器学习的文章中讲过，机器学习之所以看上去可以解决很多复杂的...

2021-03-23 16:07:39 2540 1

转载 HBase二级索引方案

01 HBase简介HBase是一个构建在HDFS之上，用于海量数据存储分布式列存储系统。参见下图，由于在HBase中：表的每行都是按照RowKey的字典序排序存储表的数据是按照RowKey区间进行分割存储成多个region所以HBase主要适用下面这两种常见场景：适用于基于rowkey的单行数据快速随机读写适合基于rowkey前缀的范围扫描02 为什么需要HBse二级索引HBase里面只有rowkey作为一级索引，如果要对库里的非rowkey字段进行数据检索和查询，往...

2021-03-21 09:44:00 434

转载基于知识图谱的推荐系统(KGRS)综述

导语本文是2020年针对知识图谱作为辅助信息用于推荐系统的一篇综述。知识图谱对于推荐系统不仅能够进行更精确的个性化推荐，而且对推荐也是具有可解释性的，有迹可循。本文汇总了近些年来知识图谱辅助推荐系统的一些研究工作，并按不同的方法进行划分类别(下图是我根据论文画出的大纲方法类别图)；除此之外，汇总了不同场景下的知识图谱数据集，涵盖7个场景；最后阐述了未来的一些可研究方向及趋势。 ...

2021-03-10 09:47:30 13478 1

转载 ####好好好####详解深度学习中的 Normalization，不只是 BN

本文作者Juliuszh，本文首发于知乎专栏【机器学习炼丹记】，AI 研习社获其授权转载。深度神经网络模型训练之难众所周知，其中一个重要的现象就是 Internal Covariate Shift. Batch Norm 大法自 2015 年由 Google 提出之后，就成为深度学习必备之神器。自 BN 之后， Layer Norm / Weight Norm / Cosine Norm 等也横空出世。本文从 Normalization 的背景讲起，用一个公式概括 Normalization 的基本思

2021-03-04 18:17:44 242 1

转载从ReLU到GELU，一文概览神经网络的激活函数

选自mlfromscratch作者：Casper Hansen机器之心编译参与：熊猫、杜伟激活函数对神经网络的重要性自不必多言，机器之心也曾发布过一些相关的介绍文章，比如《一文概览深度学习中的激活函数》。本文同样关注的是激活函数。来自丹麦技术大学的 Casper Hansen 通过公式、图表和代码实验介绍了 sigmoid、ReLU、ELU 以及更新的 Leaky ReLU、SELU、GELU 这些激活函数，并比较了它们的优势和短板。在计算每一层的激活值时，我们要用到激活函数，之后才

2021-02-25 17:30:30 533

转载关于BERT的若干问题整理记录

1.BERT的基本原理是什么？BERT来自Google的论文Pre-training of Deep Bidirectional Transformers for Language Understanding，BERT是” Bidirectional Encoder Representations from Transformers ”的首字母缩写，整体是一个自编码语言模型（Autoencoder LM），并且其设计了两个任务来预训练该模型。第一个任务是采用MaskLM的方式来训练语言模型，通俗地说就是

2021-02-24 21:14:33 3817 1

转载 ###好好好#####肝了1W字！文本生成评价指标的进化与推翻

一只小狐狸带你解锁炼丹术&NLP秘籍作者：林镇坤（中山大学研一，对文本生成和猫感兴趣）前言文本生成目前的一大瓶颈是如何客观，准确的评价机器生成文本的质量。一个好的评价指标（或者设置合理的损失函数）不仅能够高效的指导模型拟合数据分布，还能够客观的让人评估文本生成模型的质量，从而进一步推动text generation 商业化能力。然而由于语言天生的复杂性和目前技术限制，我们目前还没有一个完美的评价指标。本文就三方面对文本生成的评价指标介绍：介绍了以BLEU为代表的基于统.

2021-02-19 14:12:14 591

转载文本生成任务常见评估指标

1. 引言在传统的文本生成任务中，对于模型生成的文本，往往很难评估他们的质量，对于以往的做饭，一般会通过人工评估的方式来评选最优的模型，但是其评估过程是非常昂贵和耗时的，而且每个人的评估标准会不一致，从而导致评分出现误差，当研究人员对模型进行更新或改进之后，该过程又得重复进行，因此，影响了很多研究人员的效率。为了改善这个问题，很多学者开始对这方面进行研究，希望得出一些有效的自动评估方法，来自动对文本生成模型进行评估，这过程衍生出了很多方法，笔者通过查看近些年来的一些相关文献，对这些方法大致分为了

2021-02-09 15:03:21 2573

转载通俗易懂理解——条件随机场CRF

https://mp.weixin.qq.com/s?__biz=MzIyNzE5NjExMA==&mid=2651342812&idx=1&sn=2f74c852200d6868f68a2f05ba561ac8&chksm=f3980a7dc4ef836b764c7ad2bab7c92e696074af43efa2a6be03d686fcec0a4a91a05a116b38&scene=178&cur_album_id=1381650339941761024

2021-01-29 15:55:59 1928

转载线性链条件随机场-tutorial（一）

1. 导读这是一篇面向有一定机器学习基础读者的教程，文中不会涉及太多概率图模型的内容。该教程主要介绍了条件随机场（Conditional random fields）的定义。首先让我们从一张流传甚广的模型关系图开始，如下图中所示，隐马尔可夫模型与线性链条件随机场是一对 “生成-判别对”（generative-discriminative pair）。可以理解为它们是一对近亲，模型非常相似。但究竟是哪里相似，图中的“条件化”（conditional）又是何意？本篇教程将会为你解答。这篇教.

2021-01-27 14:21:57 891 1

转载 Google预训练语言模型T5

这几天NLP领域又炸锅了，Google又祭出预训练模型大杀器T5（Text-to-Text Transfer Transformer），既在情理之中，又在意料之外。在情理之中是因为，BERT及后续改进模型出来后，大的趋势是更复杂的模型和更多的数据，个人觉得Google应该不会满足于BERT，19年应该还会有大杀招出来。在意料之外是因为，没有想到T5会干得这么彻底，有一种惨无人道的感觉，这让大家以后还往哪做啊。下面所讲纯属个人思考，眼光有限，错误难免，谨慎参考。T5的出世我感觉让一些研究人员会有种绝.

2021-01-27 10:28:29 1901

转载 RNN LSTM GRU 讲解

前言平时很少写总结性的文章，感觉还是需要阶段性总结一些可以串在一起的知识点，所以这次写了下。因为我写的内容主要在时序、时空预测这个方向，所以主要还是把rnn，lstm，gru，convlstm，convgru以及ST-LSTM一、 RNN最为原始的循环神经网络，本质就是全连接网络，只是为了考虑过去的信息，输出不仅取决于当前输入，还取决于之前的信息，也就是输出由之前的信息(也就是状态state)和此时的输入决定。1.1 结构图1.2 公式1.3 优缺点1.3.1 优.

2021-01-25 17:26:18 1933

转载 ##haohaohao##概率图模型学习笔记：HMM、MEMM、CRF

作者：Scofield链接：https://www.zhihu.com/question/35866596/answer/236886066来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。概率图模型学习笔记：HMM、MEMM、CRF一、Preface二、Prerequisite 2.1 概率图2.1.1 概览2.1.2 有向图 vs. 无向图2.1.3 马尔科夫假设&马尔科夫性2.2 判别式模型 vs. 生成式模型2.3 序列建模三、H.

2021-01-21 10:40:57 453

转载 KDD 2020 | 会话推荐系统新进展：基于互信息最大化的多知识图谱语义融合

论文标题： Improving Conversational Recommender Systems via Knowledge Graph based Semantic Fusion论文来源： ACM SIGKDD 2020论文链接： https://arxiv.org/abs/2007.04032会话推荐系统(conversation recommender system, CRS)旨在通过交互式的会话给用户推荐高质量的商品。通常CRS由寻求商品的user和推荐商品的system组成，通..

2021-01-19 09:47:42 958

转载 ###好好###远离送命题: 问答系统中语义匹配的『杀手锏』

本文将介绍一套『独创』的语义匹配方法论和一个杀手级模型本文受众: 自然语言处理/问答系统/智能助手/搜索/推荐等相关行业从业者对自然语言处理/智能助手感兴趣的普通读者 1. 引子『问&答』是人和人之间非常重要的沟通方式，其关键在于：我们要理解对方的『问题』，并给出他想要的『答案』设想这样一个场景，当你的女朋友or老婆大人在七夕前一晚，含情脉脉地跟你说亲爱的，七夕快到了，可以给我换个新手机吗？而此时沉迷王者峡谷的你，也许会不假思索地回答好啊亲..

2021-01-15 17:19:16 369

转载 ACL 2020论文分享 | 基于对话图谱的开放域多轮对话策略学习

本文对百度NLP入选ACL 2020的论文《Conversational Graph Grounded Policy Learning for Open-Domain Conversation Generation》进行解读，该论文提出用图的形式捕捉对话转移规律作为先验信息，用于辅助开放域多轮对话策略学习，并提出了一个基于CG的策略学习框架。引言研究人员首先从对话语料库中构建了一个对话图谱（Conversational Graph），其中节点表示“What to say”和“How t...

2021-01-12 09:47:23 454

转载智能扩充机器人的“标准问”库之Query生成

我司开源了一个GPT2模型，进行Query生成。代码模型见链接：https://github.com/YunwenTechnology/QueryGeneration一、Query生成的目的及意义？在问答系统任务（问答机器人）中，我们往往会人为地配置一些常用并且描述清晰的问题及其对应的回答，我们将这些配置好的问题称之为“标准问”。当用户进行提问时，常常将用户的问题与所有配置好的标准问进行相似度计算，找出与用户问题最相似的标准问，并返回其答案给用户，这样就完成了一次问答操作。但是人为配置“标准

2021-01-05 10:12:03 654

转载 35岁技术人如何转型做管理？阿里高级算法专家公开10大思考

简介： 35岁左右对工程师而言是个不同寻常的年龄段。技术人有可能面临人生中的转型：从纯技术岗转向管理岗。也将面临诸多新的挑战，关于组建团队、领导以及KPI设置等。本文将讲述阿里资深技术leader张荣从去年1月底接手CRO线NLP算法团队以来，在团队组建、能力建设、以及管理上的一些思考。这些思考从实践中来，总结出一套方法论，希望能给予转型中的技术人一些启发。张荣，花名威视，现任职阿里巴巴 CRO 线 NLP 算法团队 leader ，长期聚焦于 NLP 、图像识别、视频分析算法领域。作者 | 威视.

2020-12-31 18:02:25 401

转载一种融合了NLU和NLG的生成模型

论文标题：A Generative Model for Joint Natural Language Understanding and Generation论文来源：ACL2020论文链接：https://arxiv.org/pdf/2006.0749...论文源码：https: //github.com/andy1946...Abstract自然语言理解和自然语言生成是构建任务型对话系统的两个基础而相关的工作，但两者处理的过程相反。NLU将自然语言转化为形式化的表达，而NLG则做相反的转换。在这

2020-12-31 16:17:10 794

转载多模态知识图谱

知识图谱技术已经被广泛用于处理结构化数据（采用本体+D2R技术）和文本数据（采用文本信息抽取技术），但是还有一类非结构化数据，即视觉数据，则相对关注度较低，而且相缺乏有效的技术手段来从这些数据中提取结构化知识。最近几年，虽然有一些多模态视觉技术提出，这些技术主要还是为了提升图像分类、图像生成、图像问答的效果，不能很好地支撑多模态知识图谱的构建。视觉数据库通常是图像或视频数据的丰富来源，并提供关于知识图谱中实体的充分视觉信息。显然，如果可以在在更大范围内进行链接预测和实体对齐，进而进行实体关系抽取，可以使现有

2020-12-31 11:03:25 924

转载人工智能产品流程

需求验证篇1.人工智能产品的本质价值（大数据，云计算，算法）（善于做感知，识别性质的事，机器学习，通过数据生成模型预测。。。。）人工智能 = 人工 + 智能；愿景：规模化服务某一个行业或多个行业而非走定制路线2.人工智能产品需求获取（围绕技术打造）（了解客户是C端还是B端；了解客户从哪里获取，了解客户的核心需求是什么）通过做外包，做定制化深入了解某行业，了解客户需求，需求驱动3.零基础人工智能产品获客：行业大佬介绍，商务售前，冷启动获客产品市场调研的必要性：价值（搞清市场空

2020-12-31 09:50:57 462

转载如何从职场到创业，什么样的公司能够留住人才

主要是最近接到蛮多这种，职场转创业的问题，尤其是一些收入还挺高的，作为过来人，给大家科普一下。第一部分《打工为什么不开心，如何从职场过渡到创业》。先说我身边的，分为两种人。一毕业就没打过工的，这是极少数。另外绝大部分还是会去打工的。这个是父母辈的积累，略有差异，这个没得选择。然后是地域的差异，偏北方一些的偏向学术安稳，创业的思维比较淡一些，大多是让子女去找个工作给人打工，或者是做老师，做公务员这种铁饭碗。偏南方一些，那就是要做大老板，要光宗耀祖。所以，南方的创业比例会略高一些。这么多年祖祖辈辈的传承，也

2020-12-30 22:07:57 253

转载 ###好好好###ACL 2020 | 新任务：融合多个对话类型的对话式推荐

本文对百度入选ACL 2020的论文《Towards Conversational Recommendation over Multi-Type Dialogs》进行解读，该论文提出了一个新对话任务：融合多个对话类型的对话式推荐。本论文地址：https://arxiv.org/pdf/2005.03954.pdf建议大家点击阅读以下文章，以更加了解人机对话技术：一文看懂人机对话：https://mp.weixin.qq.com/s/fkcZOVJUreZqj7aQBkslog动机人机对

2020-12-30 10:40:25 229

转载 ###haohaohao####知识图谱补全技术

导读：当前知识图谱已经被广泛应用在自然语言处理的各项任务中，但知识图谱中实体间关系的缺失也给其实际的应用带来了很多问题。因此，目前学术界围绕知识图谱的补全进行了大量的研究工作。本文主要对知识图谱补全相关的研究进展进行了归纳与分享。01背景介绍首先和大家分享下知识图谱的背景。知识图谱，在互联网行业已经被广泛应用于多种不同的领域，如推荐系统、搜索引擎、智能对话系统等。在AI时代，知识图谱是一项非常重要的技术。1.知识图谱主要研究方向知识图谱的主要研究方向包括知识获取、知识表示、.

2020-12-29 11:35:21 948

转载 “哪吒”出世！华为开源中文版BERT模型

　自Google于2018年发布预训练语言模型BERT ，并在11项自然语言处理（NLP）任务上取得最好成绩，预训练语言模型开始得到学术界和工业界的极大关注，已经成为自然语言处理的新范式。各个公司和高校的研究团队陆续推出了新的预训练语言模型，并不断刷新NLP任务上的记录，如CMU和Google推出的XLnet ，Facebook AI推出的RoBERTa ，百度推出的ERNIE 等。　　华为诺亚方舟实验室语音语义团队与海思、云BU等团队合作，共同研究大规模预训练模型的训练技术，发布了自己的中文预训练语言

2020-12-28 21:25:19 1036

转载文档级（Document-level）关系抽取（RE）目前的一些最新进展（海量论文，干货满满）

文章目录0. 引言 1. SCIREX: A Challenge Dataset for Document-Level Information Extraction(ACL2020) 1.1 摘要 1.2 动机 1.3 贡献 1.4 数据集 1.4.1 问题定式 1.4.2 数据集描述 1.5 模型 1.6 实验 2. Reasoning with Latent Structure Refinement for Document-Level Rel

2020-12-28 14:56:48 1600

转载 ###好好好####RL-GAN For NLP: 强化学习在生成对抗网络文本生成中扮演的角色

目录【导读】本文全面系统性梳理介绍了强化学习用于发掘GAN在NLP领域的潜力，请大家阅读。1. 基础：文本生成模型的标准框架2. 问题：GAN为何不能直接用于文本生成2.1. GAN基础知识2.2. GAN面对离散型数据时的困境（啥是离散型数据？）3. 过渡方案：对于GAN的直接改进用于文本生成3.1. Wasserstein-divergence，额外的礼物3.2. Gumbel-softmax，模拟Sampling的softmax4. RL在GAN文本生成中所扮演的作

2020-12-23 15:00:36 523

转载 MVP释义：做最小可行产品

MVP是指最小可行性产品。在MVP中的P代表了产品（Product），MVP对我来说代表了一种如何通过尽可能少的工作量，尽可能低的价格，尽可能快的对真正的市场进行测试。建立一个最小可行的产品（MVP）是一种避免客户所不希望的产品开发的战略。主要的想法是要能够快速建立足以部署产品并根据客户需要的交互要求来对产品进行主要假设测试的最小的功能集合。它不同于传统的在核实客户是否想要该产品之前就投入时间和金钱来实现整个产品的策略。相对于传统的通常提供误导性结果的依赖于调查或焦点小组的市场研究而言，MVP测试..

2020-12-18 09:09:14 3634

知网Hownet情感词典.zip

mnist.pkl.gz数据文件

近红外猕猴桃测试分类数据

ROC曲线 源代码包

Harris角点提取算法在H型目标追踪上的研究

基于tiny210的SD卡MP3播放器系统代码

机器学习实战源代码

基于FPGA的视频图像采集系统的设计与实现

多人物识别

空空如也

ROC曲线源代码包