paddle
SZU_Hadooper
数据挖掘工程师
展开
-
百度Paddle深度学习框架学习
学习心得(个人心得):学习到目前感觉百度的paddle框架总体来说还是很不错的,paddle可以使用静态和动态图的方式可以很好的适合tensorflow和pytorch的童鞋门入手,并且可以快速部署自己的模型paddle_serving。paddlehub在cv领域上目前大多数模型都进行了很好的封装,使用非常简单,这使得很多预训练模型在部署和finetune上都非常方便。但是个人感觉在nlp领域上目前还是比较乱,版本更新很快,数据reader的方式有点乱,有些文档解释还不够清楚,等待后期的完善。另外原创 2020-06-21 15:34:50 · 1177 阅读 · 0 评论 -
paddle基于ernie的自定义数据集文本分类
ernie是百度开发的一个预训练模型,模型结构类似bert,没错就是ernie成功带我入paddleernie1.0在bert的基础上mask做了改进如图,后续bert也使用这种方法比如wwm的模型:ernie2.0在bert的基础上增加了更多的训练任务任务,目前还没开源以下个人观点:这些任务首先大致是pipeline的方法在各个任务上训练到最好,然后使用多任务训练的方法一起进行微调ernie模型结构也是transformer应该和bert一样,只是在训练模型时增加了更多的任务。paddle原创 2020-05-28 17:52:08 · 2402 阅读 · 0 评论 -
基于paddle的自定义数据集文本分类
文本分类可以用在NLP的很多领域,比如情感分析,意图识别,领域识别等等,先总结一波使用paddle进行文本分类的整体流程NLP任务的整体流程一般如下:1.数据处理(将数据变成可以放入到模型的格式)2.模型构建(构建你想使用的模型)3.训练和评估模型(构建loss、优化器、metrics)我们使用paddle这个框架来实现一般模型的文本分类和后续使用ernie这种预训练模型来进行文本分类1.数据处理部分这个部分包括从文件中读取数据(训练集)然后处理数据一般包括padding (类似长度不够补0原创 2020-05-26 10:47:06 · 1806 阅读 · 0 评论