笑傲NLP江湖-CSDN博客

原创生成对抗网络原理与实战

在生成对抗网络(Generative Adversarial Network，简称 GAN)发明之前，变分自编码器被认为是理论完备，实现简单，使用神经网络训练起来很稳定，生成的图片逼近度也较高，但是人眼还是可以很轻易地分辨出真实图片与机器生成的图片。

2022-05-12 11:43:30 867

原创一文概览时间序列

这篇文章介绍了几种预测的建模概念，包括线性方法（MLR、套索、岭）、树集合（随机森林、XGBoost、LightGBM）、Bagging 和 Stacking。通过增加非线性方法的复杂度，并使用巧妙的抽样方法，我们在一个包含大约 400 个观察值的测试集上获得了 10% 的测试集 MAPE 分数。

2022-05-06 17:47:55 754

原创强化学习与自动驾驶

本文主要介绍强化学习在智能交通，尤其是自动驾驶领域的应用。首先带大家了解强化学习的内涵，然后分析如何构建强化学习的问题，最后会基于项目内容去讲解自动驾驶领域中如何应用强化学习。

2022-04-27 16:19:23 2425

原创搜索内容入库

最近在做搜索推荐的东西，所以整理一些相关的内容和大家分享。

2022-04-21 15:33:48 2962

原创英特尔边缘软件中心介绍

本文旨在介绍英特尔推出的边缘软件中心。

2022-04-20 11:57:22 537

原创：程祥国1. XGBoost概述XGBoost是陈天奇提出的一个端对端的梯度提升树系统，该算法在GBDT【关于GBDT这里不再展开叙述，可以参考李航老师统计学习方法一书中对该算法的讲述】的基础之上，在算法层面和系统设计层面都做了一些创新性的改进，可以把XGBoost看作是GBDT更好更快的实现。XGBoost在许多机器学习以及数据挖掘的任务中表现惊艳，2015年，kaggle竞赛平台上发布了29个挑战获胜的解决方案，其中17个解决方案用了XGBoost。由于XGBoost在实际任务中的良好表现，因此

2022-04-14 10:51:04 1133

原创自动驾驶概述

自动驾驶技术正推动中国人工智能、互联风、汽车产业、交通产业的融合与创新发展。回顾2021年，互联网、科技企业加速布局自动驾驶行业，产业各方的融合推动了其商业化落地进程。伴随着大量资本涌入，政策监管体系初步搭建，中国自动驾驶产业已然驶入快车道。

2022-04-13 17:08:48 2300

原创词嵌入（WORD2VEC）

原创：李孟启1.前言⾃然语⾔是⼀套⽤来表达含义的复杂系统。在这套系统中，词是表义的基本单元。顾名思义，词向量是⽤来表示词的向量，也可被认为是词的特征向量或表征。把词映射为实数域向量的技术也叫词嵌⼊（word embedding）。近年来，词嵌⼊已逐渐成为⾃然语⾔处理的基础知识。2.为何不采⽤ONE-HOT向量假设词典中不同词的数量（词典⼤⼩）为NNN，每个词可以和从000到N−1N-1N−1的连续整数⼀⼀对应。这些与词对应的整数叫作词的索引。假设⼀个词的索引为 iii，为了得到该词的one-ho

2022-04-07 14:16:39 562 1

原创机器阅读理解（MRC）必看论文 - RNET

原创：张春阳数据集SQuADQA原始论文r-net.pdf论文中只介绍了原理和方法，并没有给出代码找到的代码为第三方复现需要注意，本篇中的 passage 就是之前我们说过的 context任务样本从原文中找到一个连续的 sub-spanPassage: Tesla later approached Morgan to ask for more funds to build a more powerful transmitter. When asked where all th

2022-04-01 11:29:54 652

原创横看成岭侧成峰——从谱的视角出发

前段时间发布的《图卷积神经网络打怪升级之路》一文介绍了图卷积神经网络的诞生以及三代经典 GCN 模型。该文介绍 GCN 开山之作 SCNN 时提到：“SCNN 利用谱域变换定义了 Graph 上的卷积核”，但是并没有解析所谓“谱域变换”为何物。本文将立足于谱图理论，更加详细地对"图的谱域变换"进行介绍。本文的理论性较强，相信阅读完本文的同学们可以更加深刻的从频谱角度看待 Graph 数据。虽然当下的图卷积模型越来越倾向于空域方法，但具有独特数学之美的谱域方法依然怀揣着自己独到之处，等待同学们研究、挖掘。

2022-03-24 15:11:29 1527

原创详解推荐系统的算法与应用

如果你想购物，推荐系统会帮你先“看”你想买的东西；如果你想看新闻，推荐系统会帮你先“挑”你喜欢的内容；如果你想刷剧，推荐系统会帮你“筛”掉你不喜欢的电视剧；如果你想学习，推荐系统会“考”你相关的题目；如果你想放松，推荐系统会给你“听”你爱听的音乐，这些都是推荐系统在日常生活中的具体的应用场景。

2022-03-23 17:39:00 4642

原创自然语言处理与企业对话系统设计

原创：晏茜资料来源：李俊本文分享的主题分为两个部分，第一部分内容是关于企业级对话系统的简介，第二部分探讨对话系统和自然语言处理技术结合的领域。1. 企业对话系统我们首先来介绍一下企业级对话系统。谷歌的 CEO 桑达尔在 16 年曾发表言论，人工智能将通过各式各样的智能助手来改变我们的生活方式。现在，智能助手切实存在于日常生活的方方面面。举个简单的例子，以前，我们在获取城市的交通拥堵的情况最主要的方式是我们的交通广播，而现在我们可以通过各式各样的 APP 准确的获取所在城市的实时交通情况，这是属于智

2022-03-16 17:30:20 10498

原创语言模型理论与实战

原创：李孟启1、前言什么是语言模型（language model）？简单地说，语言模型就是用来计算一个句子的概率的模型，也就是判断一句话是否是人话的概率。语言模型的应用比较广泛，可⽤于提升语⾳识别和机器翻译的性能。例如，在语音识别的过程中，给定一条语音“厨房里食油用完了”的语音，机器可能会把语音输出为“厨房⾥⻝油⽤完了”和“厨房⾥⽯油⽤完了”这两个读音相同的文本序列，如果通过提前训练好的语言模型，对识别的这两个句子进行概率计算可以判断出前者的概率大于后者的概率，我们就可以认定为句子概率较大的“厨房⾥⻝

2022-03-10 11:31:18 1077

原创 Embedding原理到实战

原创：王稳钺资料来源：张春阳词向量被应用在非常非常多的场景中，甚至可以说跟文字相关的互联网应用基本上都会跟词向量有关系。本文主要从应用、发展以及实战代码来介绍词向量。1. 词向量的应用搜索引擎是人们每天都在使用的产品，搜索引擎其实就是利用词向量技术来进行搜索的。搜索引擎是如何工作的呢？其实主要分为三步。第一步，搜索引擎需要爬取互联网上所有的文章，把这些文章全部都转化成词向量。第二步是要将搜索词也转化为词向量。最后一步就是用搜索词的词向量与文章转变成的词向量进行相似度的比较，再把与搜索词相似的文章返回

2022-03-09 16:58:50 1729

原创 NLP炼丹技巧合集

原创：郑佳伟在NLP任务中，会有很多为了提升模型效果而提出的优化，为了方便记忆，所以就把这些方法都整理出来，也有助于大家学习。为了理解，文章并没有引入公式推导，只是介绍这些方法是怎么回事，如何使用。一、对抗训练近几年，随着深度学习的发展，对抗样本得到了越来越多的关注。通常，我们通过对模型的对抗攻击和防御来增强模型的稳健性，比如自动驾驶系统中的红绿灯识别，要防止模型因为一些随机噪声就将红灯识别为绿灯。在NLP领域，类似的对抗训练也是存在的。简单来说，“对抗样本” 是指对于人类来说“看起来”几乎一样、但

2022-03-03 15:57:01 3252

原创竞赛大杀器：树模型与集成学习

原创：晏茜资料来源：Mozak竞赛无论对于在校生亦或是在职的同学，都是一种非常好的学习方式。为什么数据人才要参加竞赛呢？首先，Kaggle，天池，百度的飞桨等竞赛平台为数据人才提供了优质的竞赛环境；其次，竞赛是符合国家政策导向的，2021年《十四个五年规划和 2035 年远景目标纲要》中明确提出，强化国家战略科技力量，加快数字化发展的发展目标；除此之外，面对社会对数据人才的广泛需求，数据人才更应紧跟技术发展与产业升级的脚步，了解竞赛对于个人成长与发展的价值，积极参与竞赛。本文主要围绕树模型与集成学习的

2022-03-02 15:39:04 459

原创机器阅读理解（MRC）必看论文 - BiDAF

原创：张春阳应用和数据集QASQuAD后续影响ELMoBERT原始论文BI-DIRECTIONAL ATTENTION FLOW FOR MACHINE COMPREHENSION.pdf原文的主要阅读难度在于，有大量的 block 组装在一起这些模块又由很多复杂的符号组装在一起模型概览Type of MRCOpen-domain vs Closed-domainAbstractive vs ExtractiveAbility to answer non-fac

2022-02-24 18:57:54 749

原创人工智能的落地及未来的发展

原创：晏茜资料来源：张春阳0 什么是人工智能什么是人工智能呢？不同人对人工智能的定义是不尽相同的，这里给大家总结了人工智能的不同类型的定义。① AI 就是让人觉得不可思议的计算机程序。首先，第一种定义是，AI 就是让人觉得不可思议的计算机程序。原来我们对于程序的认知可能仅限于它可以纯粹的做一些机械的、重复的动作，这是普通的计算机程序的作用，而如果我们发现某个程序已经超出了这样的认知范围了，我们就可以认为它是一个人工智能的程序。② AI 就是与人类思考方式相似的计算机程序。第二种定义是，AI 是

2022-02-23 15:23:49 1121

原创智能科学反思与展望

本文主要从脑科学、思维科学以及辩证逻辑三个方面，对现阶段的智能科学做出一个探讨及未来发展的展望。

2022-02-17 17:05:11 1249

原创 AI行业分析与面试指南

原创：晏茜资料来源：陈旸近年来，人工智能行业的受欢迎程度是有目共睹的，越来越多的人想要加入 AI 这个行业。但是在我们正式开始求职之前，应该进行理性的分析，了解现阶段 AI 行业的发展趋势，AI 行业需要什么样的人才，AI 人才需要掌握什么样的知识技能才能谋求更好的职业发展机会，本文将带大家深入了解 AI 发展趋势和 AI 人才必备技能，希望能够帮助求职者找到正确的方向。本文将大致分为三个方向。首先我们先带大家了解一下我们所处的时代有哪些关键的技术变革；其次，会带大家了解除了大厂以外，还有哪些传统的

2022-02-16 16:51:43 1338

原创图卷积神经网络打怪升级之路

原创：袁一歌前言导语图结构数据 (Graph) 广泛的存在于我们的日常生活之中，从社交网络错综复杂的人际关系，到化学分子键键相连的结构特征。图卷积神经网络(Graph Convolutional Network, GCN) 正是一类对这种图结构数据进行建模的算法。本文《图卷积神经网络打怪升级之路》将从 GCN 的诞生以及三代 GCN 的进阶升级的角度对图卷积领域进行简要介绍，下面让我们开始吧~从 CNN 到 GCNCNN 卷积神经网络卷积神经网络(Convolutional Neural Netw

2022-02-14 17:52:02 696

原创 StarSpace：低调却好用的 Embed 算法

原创：张春阳这篇文章是偶然的机会在看一个 Conference 的时候听到的，当时第一感觉是 StarSpace，哇，在到处都是各种看不懂的字母堆叠的算法名称里，这名字给人的感觉眼前一亮，让我想去看看这篇文章。一查才知道，文章也是师出有门，是 Facebook AI Research 发表在 2017 年的一篇文章，文章的名字也很有意思， StarSpace: Embed All The Things! ，要 embed 一切，目标够大！我喜欢！一直以来，我都很喜欢工业界出的文章，因为总是可以最

2022-02-10 15:34:36 306

原创带你上手 AI 大赛

本文的主要内容包括以下环节，首先既然文章内容是关于 AI 大赛的，我希望大家直接跟随作者上手去打一场比赛，在这篇文章中，会以保险反欺诈预测比赛为例，通过介绍整个比赛的过程，我们会了解到常用的机器学习神器，同时也会给大家介绍一个工具 —— AutoML。

2022-02-09 11:16:03 383

原创关于Attention的总结

原创：郑佳伟学习NLP的同学，Bert可以认为是必学的一个模型，而Bert中self-attention同样是必不可少的一个知识点。接下来，咱们就对self-attention和其他attention结构进行总结。1、什么是AttentionAttention机制最早是在视觉图像领域提出来的(上世纪90年代)，但是真正热门起来是由google mind团队于2014年的论文《Recurrent Models of Visual Attention》，他们在RNN模型上使用了Attention机制来进行

2022-01-27 14:45:35 1844

原创 2022 AI 岗位风向标

原创：晏茜资料来源：单博1. AI 算法岗能力需求1.1 人工智能现在在哪里？人工智能无处不在，它早已融入我们日常生活的方方面面，人工智能的出现，彻底改变人们的工作和生活方式。有没有发现每天的抖音给你推荐的视频，你是不是越看越爱看？每次上淘宝，你是不是总能看到自己喜欢的东西？网易云音乐中是不是依靠推荐歌单，你已经收藏了很多歌曲？你的手机是不是能够自动识别你的脸部？你的 Office PPT 或者 WPS 是不是能自动排版了？坐高铁或者飞机的时候，是不是基本上都自动身份检测了？这些在生活中司空见惯的

2022-01-25 17:05:05 6517

原创图分类预测

原创：梁华雄导入图级别的预测可以完成对整个图属性的预测，比如在生化预测任务中，可以实现对某个分子是否产生变异进行预判。在非欧几里得的数据结构中，如社交网络（facebook），生物网络（基因，分子），基础设施网络（能源，交通，互联网，通信）具有重要的意义。1. 原理整图预测是针对图层面的学习任务，比如判断某药物分子是否具有某种理化性质，再比如判断某社团是否具有欺诈可能，这需要我们对整个图提取它的特征表示，然后再基于此构建我们的学习任务，图的整体特征无外乎来源于三部分：1）节点特征；2）边特征；3

2022-01-20 11:29:41 980

原创从零开始搭建AI应用

原创：晏茜资料来源：邱丹1. intel 开发工具及实验平台介绍1.1 Intel® OpenVINO™工具包定义Intel® OpenVINO™ 工具包是为了让英特尔的硬件平台最大的发挥它的算力出来而诞生的工具套件。Open 代表开源的。V 代表 Visual，说明它是基于计算机视觉应用的，N 代表的是 Network，O 代表的是 Optimization，网络优化。所以，Intel® OpenVINO™ 工具包是开源的用于优化计算机视觉应用以及模型性能的一套工具包。特点Intel® Op

2022-01-18 18:17:01 4235

原创全球只有3000人获得Google认证的TensorFlow Developer

原创：晏茜1. TensorFlow Developer是什么？TensorFlow Developer是Google给全世界人工智能开发者提供的一种评定机器学习和深度学习能力的认证证书。简单来说就是Google认证的TensorFlow开发者。1.1 深度学习框架市场占有率目前来看，在整个工业界或学术界，有TensorFlow、Keras、PyTorch、Theano、MXNET、CNTK，FastAI这几种框架。其中MXNET、CNTK，FastAI相对比较小众，使用率较高的是前面几种，尤

2022-01-14 11:00:19 748

原创 LSTM内部结构-我彻底明白了

原创：李孟启1、背景LSTM（Long Short-term Memory，LSTM）长短期记忆[1]，是一种用于处理序列数据的神经网络。相比一般的神经网络来说，他能够处理序列变化的数据。比如某个单词的意思会因为上文提到的内容不同而有不同的含义，LSTM就能够很好地解决这类问题。本教程适合入门深度学习的小白，大神请绕行，你要是即将参加面试，那么这篇文章也会对你产生帮助。2、LSTM结构如图1所示，这是一个时刻的LSTM的内部结构图，多个时刻就是下图在横向上拼接组成。（1）从图中我们可以看到有三

2022-01-14 10:46:57 703

原创关于BERT预训练模型，你想知道的都在这~

原创：晋百川BERT模型自18年10月推出，到目前为止已经有3年多时间了。BERT问世即引起轰动，之后，各种改进版本的预训练模型（Pre-Training Model, PTM）与应用层出不穷。BERT及它的继任者们，确实也不负众望，在多种NLP数据集竞赛榜单，连续多年被各种新出现的预训练模型霸榜，有些榜单，个别模型已经把指标刷到超过人类。今天就带大家聊一下BERT并进行案例实战。一、BERT介绍BERT的架构图如图1所示，从架构图我们可以看到BERT分三个模块，分别是Embedding模块、Tra

2022-01-13 17:07:56 4407

原创残差网络（ResNet）解决梯度消失问题

一、引言残差网络（ResNet）是何凯明在2015年提出的。可以说该网络模型的提出是CNN图像史上的里程碑事件。它解决了当时传统CNN网络发展所遇到的瓶颈——网络深度问题。当时，人们普遍认为网络的深度越深，网络的效果会越好。但是随着人们的研究发现，更深的网络居然会使得网络效果变差，这也就是网络的退化，而梯度消失则是导致网络退化的一个重要因素。何凯明提出的ResNet正是解决了问题，将14年VGG的19层网络提高到了ResNet惊人的152层，并且获得了更好的网络效果。二、梯度消失：

2021-11-18 17:29:49 4451

原创 Flask深度学习模型服务端部署

1、Flask框架简介Flask是一个使用Python编写的轻量级Web应用框架，可扩展性很强，相较于Django框架，灵活度很高，开发成本底。它仅仅实现了Web应用的核心功能，Flask由两个主要依赖组成，提供路由、调试、Web服务器网关接口的Werkzeug 实现的和模板语言依赖的jinja2，其他的一切都可以由第三方库来完成。2、Flask框架安装在使用Flask之前需要安装一下，安装Flask非常简单只需要在在命令行输入pip install flask即可3、Flask实现 Hell

2021-11-11 14:36:09 6951 4

原创机器翻译seq2seq+Attention（理论+代码）

导语：看本文之前，你应该熟悉RNN（LSTM、GRU）工作原理、pytorch中LSTM的使用以及一些张量操作。1.前言seq2seq 是一个Encoder–Decoder 结构的网络，它的输入是一个序列，输出也是一个序列， Encoder 中将一个可变长度的信号序列变为固定长度的向量表达，Decoder 将这个固定长度的向量变成可变长度的目标的信号序列。如下是 Seq2Seq 模型工作的流程：图1中无论是编码器还是解码器，都是用的循环神经网络，编码器用来分析输入序列，解码器用来生成输出序列。我们可

2021-11-04 14:07:10 1375

原创 “多尺度”目标检测问题

一、“多尺度”目标检测问题简介在目标检测任务中，被测目标的大小经常是不固定的，自动驾驶相关检测任务可能要同时检测大卡车与小狗；工业质检相关检测任务可能要同时检测布料的大面积撕裂与小穿孔；医疗病灶检测任务可能要同时检测大小不一的病灶。在被测物体尺度相差极大时，模型通常难以对极大和极小的物体同时进行检测。首先，要知道为什么被测物体尺度相差过大会造成模型精度降低。物体检测领域中各个模型的骨干网络，无外乎不是使用多层卷积逐步提取图像深层信息，生成多层特征图，并基于深层特征图做定位、分类等进一步处理。在这“由

2021-10-28 11:29:30 4535

原创生动形象的DataLoader

整理一下 PyTorch 的 DataLoader 。先来看看官方文档：DataLoader官方文档PyTorch 出这两个类的目的是想将数据集代码和模型训练代码分离，以获得更好的可读性和模块化。数据集训练分离举个例子：有一个数据集（如下表），数据集中有四句话和每句话所对应的标签，现在要把此数据集输入模型中，做分类任务。sentence再次证明了“无敌是多么寂寞”——逆天的中国乒乓球队！ label: news_sports

2021-10-21 14:39:32 248

原创深度学习中的概率论与信息论基础

1. 一些信息论中的概念1. 自信息自信息（self-information），由香农提出，是与离散随机变量的值相关的信息量的量度，常用 bit 作为单位。通俗点来说就是一个随机事件以某个概率发生时携带的信息量有多大。可按照如下方式计算：I(x)=−log⁡2(p(x))I(x)=-\log_2(p(x))I(x)=−log2(p(x))思考一下为什么是上面这个形式进行计算？首先可以考虑一个事件发生的概率越大意味着它越有可能发生，极端一点一个概率为 1 的事件，那么它一定会发生，所以这类事件是

2021-10-14 11:56:00 167

原创浅谈医学图像处理

一、医学图像处理的意义医学图像是反映人体内部结构的图像，是现代医疗诊断的主要依据之一。目前，医学图像处理任务主要集中在图像检测、图像分割、图像配准及图像融合四个方面。医学图像数据具有可获得、质量高、体量大、标准统一等特点，使人工智能在其中的应用较为成熟。利用图像处理技术对图像进行分析和处理，实现对人体器官、软组织和病变体的位置检测、分割提取、三维重建和三维显示，可以对感兴趣区域（Region of Interest, ROI)进行定性甚至定量的分析，从而大大提高临床诊断的效率、准确性和可靠性，在医疗教学

2021-10-11 10:38:05 6872 2

原创词典构造方法之LDA主题模型

词典构造方法之LDA主题模型主题模型LDA原理理解LDA是一种非监督学习技术，可以用来识别大规模文档集（document collection）或语料库（corpus）中潜藏的主题信息。它采用了词袋（bag of words）的方法，这种方法将每一篇文档视为一个词频向量，从而将文本信息转化为了易于建模的数字信息。但是词袋方法没有考虑词与词之间的顺序，这简化了问题，同时也为模型的改进提供了契机。每一篇文档代表了一些主题所构成的一个概率分布，而每一个主题又代表了很多单词所构成的一个概率分布。举例来说，假设

2021-09-30 10:23:37 2097 1

原创深度学习 RNN基础

深度学习 RNN基础目录1、定义2、有了CNN，为什么需要RNN？3、RNN的主要应用领域有哪些呢?4、RNN的计算过程5、标准RNN前向输出流程6、RNN的建模方式7、CNN和RNN的异同点8、RNN中为什么会出现梯度消失？如何解决？9、如何理解RNN的注意力机制1、定义循环神经网络（Recurrent Neural Network, RNN）是一类以序列（sequence）数据为输入，在序列的演进方向进行递归（recursion）且所有节点（循环单元）按链式连接的递归神经网络（r

2021-09-23 10:27:13 397

原创 SVD及常见的Embedding应用详解

写这篇文章的原因是因为在一个推荐任务中使用SVD,deepwalk进行embedding之后，模型效果得到了提升，并且SVD的应用超出了进行降维的认知，感觉其中值得思考的东西很多，所以对SVD和embedding的一些方法进行整理总结。1.奇异值分解SVD(Singular Value Decomposition)1.1 SVD降维SVD是对矩阵进行分解,假设A是一个 m×nm\times nm×n 的矩阵，则 XXX 的SVD为: X=U∑VTX = U\sum V^TX=U

2021-09-16 10:19:03 921

空空如也

空空如也