自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (3)
  • 收藏
  • 关注

转载 超越BERT的广义自回归预训练方法——XLNET

原文地址:https://blog.csdn.net/qq_31456593/article/details/93015488 – 摘要:凭借对双向上下文进行建模的能力,与基于自回归语言建模的预训练方法相比,基于BERT的基于自动编码的预训练实现了更好的性能。然而,依赖于对输入使用掩码,BERT忽略了屏蔽位置之间的依赖性,并且受到预训练 - 微调差异的影响。根据这些优点和缺点,我们提出了XLNe...

2019-06-20 16:16:22 1097

原创 大数据----Spark中决策树模型Pipeline的建立 和 两种验证方法(完整版)

一、数据预处理 1、加载数据 2、SparkSession读取CSV格式文件 3、清洗数据 4、特征处理 4.1、StringIndexer 4.2、OneHotEncoder 4.3、VectorAssembler 二、建模 分类决策树DecisionTreeClassifier 三、评估(ROC曲线) 四、打包(ML Pipeline) Step 1...

2019-06-19 09:45:50 1610

原创 深度学习----NLP-TextRank的textrank4zh模块源码解读

文章目录1. textrank4zh模块源码解读2 textrank4zh模块的使用2.1 textrank4zh模块的安装2.2 textrank4zh的使用实例1)提取关键词、关键短语和关键句2)展示textrank4zh模块的三种分词模式的效果 TextRank算法是一种文本排序算法,由谷歌的网页重要性排序算法PageRank算法改进而来,它能够从一个给定的文本中提取出该文本的关键词、关键...

2019-06-19 09:40:30 2227

spark练习数据

spark练习数据spark练习数据spark练习数据spark练习数据

2018-07-30

Hive集成Python分析数据

Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive

2018-07-26

pandas+matplotlib练习数据

练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~

2018-07-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除