ManziHE-CSDN博客

原创百度飞桨PaddlePaddle学习

学习了人工智能、机器学习、深度学习的关系机器学习的实现机器学习的实现可以分成两步：训练和预测，类似于我们熟悉的归纳和演绎。深度学习机器学习算法理论在上个世纪90年代发展成熟，在许多领域都取得了成功应用。但平静的日子只延续到2010年左右，随着大数据的涌现和计算机算力提升，深度学习模型异军突起，极大改变了机器学习的应用格局。今天，多数机器学习任务都可以使用深度学习模型解决，尤其在语音、计算机视觉和自然语言处理等领域，深度学习模型的效果比传统机器学习算法有显著提升。神经网络的基本概念人工神经网络包括

2020-08-16 10:02:53 353

原创 Task6 基于深度学习的文本分类3

文本表示方法Part4Transformer原理Transformer是在"Attention is All You Need"中提出的，模型的编码部分是一组编码器的堆叠（论文中依次堆叠六个编码器），模型的解码部分是由相同数量的解码器的堆叠。基于预训练语言模型的词表示基于预训练语言模型的词表示由于可以建模上下文信息，进而解决传统静态词向量不能建模“一词多义”语言现象的问题。最早提出的ELMo基于两个单向LSTM，将从左到右和从右到左两个方向的隐藏层向量表示拼接学习上下文词嵌入。而GPT用Transf

2020-08-04 19:34:21 312

原创 Task5 基于深度学习的文本分类2

文本表示方法 Part3词向量本节通过word2vec学习词向量。word2vec模型背后的基本思想是对出现在上下文环境里的词进行预测。对于每一条输入文本，我们选取一个上下文窗口和一个中心词，并基于这个中心词去预测窗口里其他词出现的概率。因此，word2vec模型可以方便地从新增语料中学习到新增词的向量表达，是一种高效的在线学习算法（online learning）。word2vec的主要思路：通过单词和上下文彼此预测，对应的两个算法分别为：Skip-grams (SG)：预测上下文Continu

2020-07-31 22:21:28 163

原创 Datawhale零基础入门NLP Task4 基于深度学习的⽂本分类1

文本表示方法 Part2现有文本表示方法的缺陷在上一章节，我们介绍几种文本表示方法：1.One-hot2.Bag of Words3.N-gram4.TF-IDF也通过sklean进行了相应的实践，相信你也有了初步的认知。但上述方法都或多或少存在一定的问题：转换得到的向量维度很高，需要较长的训练实践；没有考虑单词与单词之间的关系，只是进行了统计。与这些表示方法不同，深度学习也可以用于文本表示，还可以将其映射到一个低纬空间。其中比较典型的例子有：FastText、Word2Vec和Bert。

2020-07-27 21:36:12 174

原创 Datawhale零基础入门NLP Task3

3 Task3 基于机器学习的⽂本分类3.1.2 机器学习模型机器学习是对能通过经验自动改进的计算机算法的研究。机器学习通过历史数据训练出模型对应于人类对经验进行归纳的过程，机器学习利用模型对新数据进行预测对应于人类利用总结的规律对新问题进行预测的过程。机器学习有很多种分支，对于学习者来说应该优先掌握机器学习算法的分类，然后再其中一种机器学习算法进行学习。由于机器学习算法的分支和细节实在是太多，所以如果你一开始就被细节迷住了眼，你就很难知道全局是什么情况的。文本表示方法 Part1在机器学习算法的

2020-07-25 20:58:08 132