自然语言处理
自然语言处理
迷途小龙驹
写文章记录自己研究旅途的成长。单凭自学和各位大佬的循循教导,早日修成硬软件开发的正果。活到老,学到老。
展开
-
新闻文本分类--任务6 基于深度学习的文本分类3
Task6 基于深度学习的文本分类3基于深度学习的文本分类学习目标 了解Transformer的原理和基于预训练语言模型(Bert)的词表示 学会Bert的使用,具体包括pretrain和finetune 文本表示方法Part4Transformer原理Transformer是在"Attention is All You Need"中提出的,模型的编码部分是一组编码器的堆叠(论文中依次堆叠六个编码器),模型的解码部分是由相同数量的解码器的堆叠。我们重点关注编码部分原创 2020-07-22 21:21:20 · 493 阅读 · 1 评论 -
新闻文本分类--任务5 基于深度学习的文本分类2
Task5 基于深度学习的文本分类2在上一章节,我们通过FastText快速实现了基于深度学习的文本分类模型,但是这个模型并不是最优的。在本章我们将继续深入。基于深度学习的文本分类本章将继续学习基于深度学习的文本分类。学习目标 学习Word2Vec的使用和基础原理 学习使用TextCNN、TextRNN进行文本表示 学习使用HAN网络结构完成文本分类 文本表示方法 Part3词向量本节通过word2vec学习词向量。word2vec模型背后的基本思想是对原创 2020-07-22 21:19:57 · 375 阅读 · 0 评论 -
新闻文本分类--任务4 基于深度学习的文本分类1
Task4 基于深度学习的文本分类1在上一章节,我们使用传统机器学习算法来解决了文本分类问题,从本章开始我们将尝试使用深度学习方法。基于深度学习的文本分类与传统机器学习不同,深度学习既提供特征提取功能,也可以完成分类的功能。从本章开始我们将学习如何使用深度学习来完成文本表示。学习目标 学习FastText的使用和基础原理 学会使用验证集进行调参 文本表示方法 Part2现有文本表示方法的缺陷在上一章节,我们介绍几种文本表示方法: One-hot B原创 2020-07-22 21:18:25 · 480 阅读 · 0 评论 -
新闻文本分类--任务3 基于机器学习的文本分类
Task3 基于机器学习的文本分类在上一章节,我们对赛题的数据进行了读取,并在末尾给出了两个小作业。如果你顺利完成了作业,那么你基本上对Python也比较熟悉了。在本章我们将使用传统机器学习算法来完成新闻分类的过程,将会结束到赛题的核心知识点。基于机器学习的文本分类在本章我们将开始使用机器学习模型来解决文本分类。机器学习发展比较广,且包括多个分支,本章侧重使用传统机器学习,从下一章开始是基于深度学习的文本分类。学习目标 学会TF-IDF的原理和使用 使用sklearn的机器学原创 2020-07-22 21:16:41 · 672 阅读 · 0 评论 -
新闻文本分类--任务2 数据读取与数据分析
在上一章节,我们给大家简单介绍了赛题的内容和几种解决方案。从本章开始我们将会逐渐带着大家使用思路1到思路4来完成本次赛题。在讲解工具使用的同时,我们还会讲解一些算法的原理和相关知识点,并会给出一定的参考文献供大家深入学习。数据读取与数据分析本章主要内容为数据读取和数据分析,具体使用Pandas库完成数据读取操作,并对赛题数据进行分析构成。学习目标 学习使用Pandas读取赛题数据 分析赛题数据的分布规律 数据读取赛题数据虽然是文本数据,每个新闻是不定长的,但任然使用csv原创 2020-07-22 21:15:42 · 465 阅读 · 0 评论