![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP零基础入门
杨二茶
这个作者很懒,什么都没留下…
展开
-
Task6 基于深度学习的文本分类3
Task6 基于深度学习的文本分类3 基于深度学习的文本分类 学习目标 了解Transformer的原理和基于预训练语言模型(Bert)的词表示 学会Bert的使用,具体包括pretrain和finetune 文本表示方法Part4 Transformer原理 Transformer是在"Attention is All You Need"中提出的,模型的编码部分是一组编码器的堆叠(论文中依次堆叠六个编码器),模型的解码部分是由相同数量的解码器的堆叠。 我们重点关注编码部分。他们结构完全相同,但是并不原创 2020-08-04 23:26:05 · 283 阅读 · 0 评论 -
Datawhale NLP入门:Task5 基于深度学习的文本分类2
Task5 基于深度学习的文本分类2 在上一章节,我们通过FastText快速实现了基于深度学习的文本分类模型,但是这个模型并不是最优的。在本章我们将继续深入。 基于深度学习的文本分类 本章将继续学习基于深度学习的文本分类。 学习目标 学习Word2Vec的使用和基础原理 学习使用TextCNN、TextRNN进行文本表示 学习使用HAN网络结构完成文本分类 文本表示方法 Part3 词向量 本节通过word2vec学习词向量。word2vec模型背后的基本思想是对出现在上下文环境里的词进行预测。对于每原创 2020-07-31 22:21:45 · 175 阅读 · 0 评论 -
Datewhale NLP 天池比赛:Task4
Task 04 import pandas as pd from sklearn.metrics import f1_score # 转换为FastText需要的格式 train_df = pd.read_csv('train_set.csv', sep='\t', nrows=15000) train_df['label_ft'] = '__label__' + train_df['label'].astype(str) train_df[['text','label_ft']].iloc[:-5000原创 2020-07-27 23:56:24 · 151 阅读 · 0 评论 -
Datawhale零基础入门NLP赛事Task 02: 数据读取与数据分析
Datawhale零基础入门NLP赛事Task 02: 数据读取与数据分析 今天开始第二个task,要用数据进行实操了呢! 首先按照比赛要求准备好响应的库,然后就可以开始了。 今天主要用到的库:Pandas 学习目标 学习使用pandas读取赛题数据 分析赛题数据的分布规律 数据读取 import pandas as pd #首先把pandas导入进来 news_label = {'科技': 0, '股票': 1, '体育': 2, '娱乐': 3, '时政': 4, '社会': 5, '教育': 6原创 2020-07-22 22:47:01 · 141 阅读 · 0 评论 -
Datawhale零基础入门NLP——新闻文本分类(一)熟悉赛题(天池比赛)
这里写自定义目录标题Datawhale零基础入门NLP——新闻文本分类(一)熟悉赛题(天池比赛)一、赛题背景二、赛制说明三、赛题数据四、 评测标准五、结果提交六、 专题学习资料七、解题思路 Datawhale零基础入门NLP——新闻文本分类(一)熟悉赛题(天池比赛) 一、赛题背景 这次是第三场赛事,赛事名称为零基础入门NLP之新闻文本分类挑战赛。 背景:自然语言处理 目的:根据新闻文本字符对新闻的类别分类 目标:接触预处理、模型构建和模型训练等知识点 二、赛制说明 本次赛事分为两个阶段: 正式赛(7.原创 2020-07-21 23:43:30 · 352 阅读 · 0 评论