自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

摩登都市天空---专栏

学习是为了远航,其历程要有内涵、有意义、有质量、有成效,还需要增进续航力。

  • 博客(2)
  • 资源 (6)
  • 收藏
  • 关注

转载 [深度学习] 自然语言处理 --- Huggingface-Pytorch中文语言Bert模型预训练

CL2020 Best Paper有一篇论文提名奖,《Don’t Stop Pretraining: Adapt Language Models to Domains and Tasks》。这篇论文做了很多语言模型预训练的实验,系统的分析了语言模型预训练对子任务的效果提升情况。有几个主要结论: 在目标领域的数据集上继续预训练(DAPT)可以提升效果;目标领域的语料与RoBERTa的原始预训练语料越不相关,DAPT效果则提升更明显。 在具体任务的数据集上继续预训练(TAPT)可以十分“廉价”地

2020-07-23 11:55:45 15008 5

原创 [大数据]PySpark原理与基本操作

spark的flatMapflatMap,有着一对多的表现,输入一输出多。并且会将每一个输入对应的多个输出整合成一个大的集合,当然不用担心这个集合会超出内存的范围,因为spark会自觉地将过多的内容溢写到磁盘。当然如果对运行的机器的内存有着足够的信心,也可以将内容存储到内存中。spark的map用同样的方法来展示map操作,与flatMap不同的是,map通常是一对一,即输入一个,对应输出一个。但是输出的结果可以是一个元组,一个元组则可能包含多个数据,但是一个元组是一个整体,因此算是一个元素

2020-07-20 17:00:39 1886 2

distributed-deep-learning-with-horovod.pdf

distributed-deep-learning-with-horovod Horovod是基于Ring-AllReduce方法的深度分布式学习插件,以支持多种流行架构包括TensorFlow、Keras、PyTorch等。这样平台开发者只需要为Horovod进行配置,而不是对每个架构有不同的配置方法。

2020-06-29

Neural Networks and Deep Learning - 神经网络与深度学习 中英双版本

Neural Networks and Deep Learning - 神经网络与深度学习 中英两个版本文件- 完美排版

2017-12-13

c++stack_和_queue用法

c++stack_和_queue用法,就是这两个函数的用法!

2011-05-01

数据结构的大量程序 相关面试题的源代码!

数据结构的大量程序代码,就是大学里面好多内容的程序代码! 数据结构的大量程序代码,就是大学里面好多内容的程序代码! 还有相关面试题的源代码!

2009-12-15

asp.net 网站

NET论坛 热点社区论坛系统 v5.0.1 是ASP写的

2008-12-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除