一、迁移学习
完成深度学习的过程一般是这个样子的:
由于数据、模型 和算力的限制,我们很难在短时间内完成一个快速准确的工程项目,所以我们会采用迁移学习(Transfer Learning)。
这里面我们使用百度的PaddleHub进行尝试,PaddleHub就是为了解决对深度学习模型的需求而开发的工具。基于飞桨领先的核心框架,精选效果优秀的算法,提供了百亿级大数据训练的预训练模型,方便用户不用花费大量精力从头开始训练一个模型。
PaddleHub的官网:https://www.paddlepaddle.org.cn/hub
PaddleHub的github地址:https://github.com/PaddlePaddle/PaddleHub
PaddleHub的课程地址:https://aistudio.baidu.com/aistudio/course/introduce/1070
PaddleHub的教程地址:https://aistudio.baidu.com/aistudio/personalcenter/thirdview/79927
PaddleHub的模型地址:https://github.com/PaddlePaddle/PaddleHub/tree/release/v1.6/demo
二、PaddleHub概述
PaddleHub完成迁移学习的过程可以被描述为六个步骤:
- 加载数据
- 加载模型
- 数据处理
- 优化策略
- 运行配置
- Finetune
Paddle的安装
$ pip install paddlehub
Hub常用的一些cmd指令:Usage: hub [ options]
Commands:
search Search PaddleHub pretrained model through model keywords.
serving Start a service for online predicting by using PaddleHub.
run Run the specific module.
helpShow help for commands.
show Show the information of PaddleHub module.
clear Clear all cached data.
list List all installed PaddleHub modules.
version Show PaddleHub’s version. install Install PaddleHub module.
download Download PaddlePaddle pretrained model/module files.
autofinetune Finetune a task by searching hyperparameters automatically.
config Configure PaddleHub.
uninstall Uninstall PaddleHub module.
测试PaddleHub-情感倾向分析Senta
import paddlehub as hub
senta = hub.Module(name=“senta_bilstm”, version=“1.0.0”)
res = senta.sentiment_classify(texts=[“智能车真有趣”])
当然,这样的项目还有很多,就不一一介绍了。