![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
天池新人赛
文章平均质量分 78
阿水ashui
这个作者很懒,什么都没留下…
展开
-
NLP学习实践天池新人赛打卡第六天
NLP学习实践天池新人赛打卡第六天Task6 基于深度学习的文本分类3文本表示方法Part4Transformer基于预训练语言模型的词表示基于Bert的文本分类Task6 基于深度学习的文本分类3文本表示方法Part4Transformer可以看台大李宏毅老师讲transformer和BERT的这两个视频,讲的很详细TransformerBERT,ELMO,GPTTransformer是在Attention is All You Need中提出的,模型的编码部分是一组编码器的堆叠(论文中依次原创 2020-08-03 12:09:03 · 145 阅读 · 0 评论 -
NLP学习实践天池新人赛打卡第五天
NLP学习实践天池新人赛打卡第五天Task5 基于深度学习的文本分类2word2vecSkip-grams原理和网络结构Skip-grams训练Word pairs and "phases"对高频词抽样Negative samplingHierarchical Softmax霍夫曼树Hierarchical Softmax过程使用gensim训练word2vecTextCNNTextRNN使用HAN用于文本分类Task5 基于深度学习的文本分类2word2vecword2vec模型背后的基本思想是对出原创 2020-07-30 13:55:41 · 321 阅读 · 0 评论 -
NLP学习实践天池新人赛打卡第四天
NLP学习实践天池新人赛打卡第三天Task4 基于深度学习的文本分类1-fastText文本表示方法 Part2FastText基于FastText的文本分类如何使用验证集调参Fasttext模型结果参数调整Task4 基于深度学习的文本分类1-fastText文本表示方法 Part2深度学习可以用于文本表示,可以将其映射到一个低纬空间。其中比较典型的例子有:FastText、Word2Vec和Bert。这里我们将介绍FastTextFastTextFastText是一种典型的深度学习词向量的表示原创 2020-07-26 12:44:47 · 204 阅读 · 0 评论 -
NLP学习实践天池新人赛打卡第三天
NLP学习实践天池新人赛打卡第三天Task3 基于机器学习的文本分类文本表示方法One-hotBag of WordsN-gramTF-IDF基于机器学习的文本分类Count Vectors + RidgeClassifierTF-IDF + RidgeClassifier本章作业作业1作业2SVMTask3 基于机器学习的文本分类文本表示方法在机器学习算法的训练过程中,假设给定 NNN 个样本,每个样本有 MMM 个特征,这样组成了 N×MN×MN×M的样本矩阵,然后完成算法的训练和预测。但是原创 2020-07-23 15:23:40 · 165 阅读 · 0 评论 -
NLP学习实践天池新人赛打卡第二天
NLP学习实践天池新人赛打卡第二天Task2 数据读取与数据分析数据读取数据分析句子长度分析新闻类别分布字符分布统计数据分析的结论本章作业假设字符3750,字符900和字符648是句子的标点符号,分析赛题每篇新闻平均由多少个句子构成统计每类新闻中出现次数对多的字符Task2 数据读取与数据分析使用Pandas库完成数据读取操作,并对赛题数据进行分析构成。数据读取import pandas as pdtrain_df = pd.read_csv('./train_set.csv', sep='\t'原创 2020-07-22 13:43:19 · 175 阅读 · 0 评论 -
NLP学习实践天池新人赛打卡第一天
Datawhale零基础入门NLP赛事 - Task1 赛题理解赛题理解学习目标赛题数据数据标签评测指标数据读取解题思路赛题理解赛题名称:零基础入门NLP之新闻文本分类赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。学习目标理解赛题背景与赛题数据完成赛题报名和数据下载,理解赛题的解题思路赛题数据赛题以匿名处理后的新闻数据为赛题数据,数据原创 2020-07-21 14:32:34 · 145 阅读 · 0 评论