- 博客(3)
- 资源 (3)
- 收藏
- 关注
转载 超越BERT的广义自回归预训练方法——XLNET
原文地址:https://blog.csdn.net/qq_31456593/article/details/93015488 – 摘要:凭借对双向上下文进行建模的能力,与基于自回归语言建模的预训练方法相比,基于BERT的基于自动编码的预训练实现了更好的性能。然而,依赖于对输入使用掩码,BERT忽略了屏蔽位置之间的依赖性,并且受到预训练 - 微调差异的影响。根据这些优点和缺点,我们提出了XLNe...
2019-06-20 16:16:22 1097
原创 大数据----Spark中决策树模型Pipeline的建立 和 两种验证方法(完整版)
一、数据预处理 1、加载数据 2、SparkSession读取CSV格式文件 3、清洗数据 4、特征处理 4.1、StringIndexer 4.2、OneHotEncoder 4.3、VectorAssembler 二、建模 分类决策树DecisionTreeClassifier 三、评估(ROC曲线) 四、打包(ML Pipeline) Step 1...
2019-06-19 09:45:50 1610
原创 深度学习----NLP-TextRank的textrank4zh模块源码解读
文章目录1. textrank4zh模块源码解读2 textrank4zh模块的使用2.1 textrank4zh模块的安装2.2 textrank4zh的使用实例1)提取关键词、关键短语和关键句2)展示textrank4zh模块的三种分词模式的效果 TextRank算法是一种文本排序算法,由谷歌的网页重要性排序算法PageRank算法改进而来,它能够从一个给定的文本中提取出该文本的关键词、关键...
2019-06-19 09:40:30 2227
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人