PaddlePaddle
愚昧之山绝望之谷开悟之坡
人工智能智慧城市元宇宙pf,无无明亦无无明尽
展开
-
PPDE系列1-PPDE指导计划开营仪式
PPDE原创 2022-11-17 20:30:42 · 113 阅读 · 0 评论 -
七、OCR-PaddlePaddle训练源码解析系列-文字识别
我们可以发现,对于第二类任务,最理想的情况是将源序列先进行分割,这样单独的对某一个音节,手语或者字符进行识别,准确率就会很高了。针对这类任务,[Alex Graves, 2006] 提出了Connectionist Temporal Classification.使用ctc进行训练有两个要求:源序列长度 >> 目标序列长度源序列的order与目标序列的order一致,且存在顺序对齐的关系。损失函数决定了整体的方向,决定了数据的构造方式以及模型的搭建方式,为何选择这样的损失函数,是背后的原理和规律。原创 2022-09-14 17:46:59 · 990 阅读 · 0 评论 -
六、OCR-PaddlePaddle训练源码解析系列-文本方向分类器
github地址: https://github.com//PaddleOCR/blob/dygraph/doc/doc_ch/angle_class.md原创 2022-09-14 14:12:23 · 648 阅读 · 0 评论 -
五、OCR-PaddlePaddle训练源码解析系列-文字检测
代表后面的是列表,列表里面的元素可以是字典,也可以是值本身。原创 2022-09-11 22:18:31 · 1541 阅读 · 0 评论 -
paddlehub应用出现paddle包报错的问题
注意,paddlehub模型会在线下载最新的,此时如果paddlepaddle安装旧版本的,会存在不兼容的报错。注意检查最新的paddle版本号原创 2022-07-06 11:53:38 · 1407 阅读 · 0 评论 -
PaddlePaddle模型服务化部署,重新启动pipeline后出现报错,trt报错
注意把服务彻底关掉,不然会报错把trt切换成gpu原创 2022-06-22 21:31:36 · 461 阅读 · 0 评论 -
GitHub Pull Requests (PR)
参考:https://blog.csdn.net/qq_44183661/article/details/1146657843、进入目录4、切换到远程分支develop5、基于远程分支develop新建本地分支new-feature以下指令可以查看所有分支情况,以及当前编辑分支6、此时可以在线更改这个分支的代码,或者本地电脑更改后拷贝到服务器7、安装pre-commitpre-commit工具来管理Git预提交钩子。它可以帮助我们格式化源代码Python,在提交(commit)前自动检查.原创 2022-06-21 19:21:00 · 834 阅读 · 0 评论 -
PaddlePaddle学习历程记录分享
PaddlePaddle的学习历程原创 2022-06-20 21:32:46 · 361 阅读 · 0 评论 -
智能客服系统系列2-端到端智能问答系统
参考代码:https://github.com/PaddlePaddle/PaddleNLP/tree/develop/applications/experimental/pipelines/examples/question-answering可视化工具参考:https://streamlit.io/ES安装参考:https://www.elastic.co/guide/en/enterprise-search/current/docker.html..................原创 2022-06-16 11:30:40 · 888 阅读 · 0 评论 -
PaddlePaddle安装镜像列表汇总
PaddlePaddle安装文档:https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/docker/linux-docker.htmlPaddlePaddle dockerhub镜像.:https://hub.docker.com/r/paddlepaddle/paddle/tags/PaddleServing 镜像.:https://github.com/PaddlePaddle/Servi原创 2022-06-15 17:39:07 · 2389 阅读 · 0 评论 -
百度飞桨PaddlePaddle最新系列AI课程回放地址
B站:https://space.bilibili.com/476867757百度直播:百度直播原创 2022-06-10 21:33:54 · 193 阅读 · 0 评论 -
人脸识别0-智慧城市系列,人脸识别和异常行为识别
一、参考资料整理智慧城市系列课程:https://aistudio.baidu.com/aistudio/education/group/info/25620检测系列课程:https://aistudio.baidu.com/aistudio/education/group/info/23670人脸识别可以搜索insightface:https://github.com/deepinsight/insightface异常行为识别可以搜索下PaddleDetection中的pp-human:https原创 2022-05-21 21:52:10 · 698 阅读 · 0 评论 -
cannot import name ‘AbsmaxQuantizer‘ from ‘paddle.fluid.contrib.slim.quantization‘ (/opt/conda/envs/
paddleslim最新版2.2.0报错,降级为2.1.1版本即可。开发过程用什么版本,后续就一点要保持版本一致,避免不兼容,增加多余麻烦。原创 2021-11-17 15:28:12 · 3274 阅读 · 3 评论 -
自动混合精度训练
https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/01_paddle2.0_introduction/basic_concept/amp_cn.html自动混合精度训练一般情况下,训练深度学习模型时使用的数据类型为单精度(FP32)。2018年,百度与NVIDIA联合发表论文:MIXED PRECISION TRAINING,提出了混合精度训练的方法。混合精度训练是指在训练过程中,同时使用单精度(FP32)和半精度(FP16),其目原创 2021-10-31 15:18:33 · 472 阅读 · 0 评论 -
backward几次就是计算梯度然后把梯度累加而已
链接:https://www.zhihu.com/question/398425328/answer/1454276131题主已经标明了是Torch,那么没区别,backward只是积累梯度而已,哪怕同一个loss,你backward两次,就是积累两倍梯度。要使用optimizer.step之后才会根据积累的梯度更新权重。至于梯度是怎么积累的,optimizer不会管。虽然其实和题目无关,但前面的答主们很嗨的研究多任务优化问题,还是很赞的。。。跑下面的程序,打印出来的梯度是一样的:import torch原创 2021-10-28 11:52:51 · 1052 阅读 · 0 评论 -
paddle模型直接本地加载
可以按内部集成的名字去加载,然后自动下载,也可以是自己下载或者自己训练好的模型,直接本地一键加载文件夹即可原创 2021-10-27 10:09:28 · 1214 阅读 · 0 评论 -
paddle可视化工具 VisualDL
![在这里插入图片描述](https://img-blog.csdnimg.cn/9a74eca3a60641989a6f3b127135622a.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA5oSa5pin5LmL5bGx57ud5pyb5LmL6LC35byA5oKf5LmL5Z2h,size_7,color_FFFFFF,t_70,g_se,x_16第一个需要构建可视化原创 2021-10-25 11:57:36 · 413 阅读 · 0 评论 -
PaddlePaddle_BERT模型蒸馏,蒸馏包括中间层的蒸馏和预测层的蒸馏
蒸馏的类型通用数据集上蒸馏,和特定数据集上蒸馏,并且在特定数据集上做数据增加效果会更好TinyBERT中蒸馏的整体过程:首先进行通用蒸馏,然后用数据增强后的数据,在特定任务上进行蒸馏,本文主要进行了第二阶段的蒸馏,模型是利用第一阶段得到的通用小模型tinybert-6l-768d-v2进行初始化。蒸馏层的选择知识的蒸馏通常是通过让学生模型学习相关的蒸馏相损失函数实现,在本实验中,蒸馏的学习目标由两个部分组成,分别是中间层的蒸馏损失和预测层的蒸馏损失。其中,中间层的蒸馏包括对Embedding层的蒸馏原创 2021-10-20 16:22:58 · 1405 阅读 · 0 评论 -
paddle模型cpu部署,压缩,量化
NAS介绍神经结构搜索(Neural Architecture Search,简称NAS)NAS的原理是给定一个称为搜索空间的候选神经网络结构集合,用某种策略从中搜索出最优网络结构。神经网络结构的优劣即性能用某些指标如精度、速度来度量,称为性能评估。这一过程如下图所示。NAS 参数重要性定义首先对预训练模型的参数和head根据其重要性进行重排序,把重要的参数和head排在参数的前侧,保证训练过程中的参数裁剪不会裁剪掉这些重要的参数。参数的重要性计算是先使用dev数据计算一遍每个参数的梯度,然后根据原创 2021-10-19 14:46:18 · 1615 阅读 · 1 评论 -
paddlenlp训练模型的标记样本数量估计以及部署模型的性能提升
Q2.2 如果使用预训练模型,一般需要多少条样本?A: 很难定义具体需要多少条样本,取决于具体的任务以及数据的质量。如果数据质量没问题的话,分类、文本匹配任务所需数据量级在百级别,翻译则需要百万级能够训练出一个比较鲁棒的模型。如果样本量较少,可以考虑数据增强,或小样本学习。Q1.5 如何提升模型的性能,提升QPS?A: 从工程角度,对于服务器端部署可以使用Paddle Inference高性能预测引擎进行预测部署。对于Transformer类模型的GPU预测还可以使用PaddleNLP中提供的Fast原创 2021-10-19 10:24:11 · 452 阅读 · 0 评论 -
飞桨黑客松#8深度学习的发展:历史、现状和未来_跟进前沿学习,除了读论文,还是读论文,外国的博客medium.com
一、跟进前沿学习,除了读论文,还是读论文,二、最新的开源读读外国的博客medium.com目的是为了分类,找到支持向量,最近的点最远深度学习问题自监督学习无监督,生成式学习和对比学习以数据为中心,与其不断的调模型参数,倒不如换个思路,反过来调节数据,类似数据增强了引入规则逻辑干预因果干预开源生态的现状...原创 2021-10-18 21:49:00 · 120 阅读 · 0 评论 -
paddlepaddle CPU模型部署加速包 MKL-DNN
模型自带即可,无需更改代码安装好带 MKL-DNN 的 MXNet 之后,我们就可以运行 MXNet 上的模型了。因为 MXNet 使用 MKL-DNN 来加速原有的操作符,所以用户并不需要修改任何代码来提升性能。下面我们用 MXNet 自带的 benchmark 来展示使用 MKL-DNN 加速的 MXNet 在 CPU 上的性能。加速说明mkldnn的作用是为cpu运行网络加速;mkldnn是intel开发的开源项目,就是针对cpu上运行神经网络做了一些并行优化;但并不是针对所有模型都有效,比如原创 2021-10-18 17:45:04 · 3060 阅读 · 0 评论 -
paddlenlp二分类引入评估召回率F1指标 paddle.metric Accuracy
每个具体的参数代表什么,明确好。无非就是第几个样本,属于某个类别的概率,非常清晰from paddlenlp.metrics import AccuracyAndF1@paddle.no_grad()def evaluate(model, criterion, metric, data_loader): """ Given a dataset, it evals model and computes the metric. Args: model(obj:.原创 2021-10-18 14:32:45 · 1812 阅读 · 4 评论 -
paddnlp直播课,小样本学习,预训练新范式prompt-tuing
一、FSL思考的视角都是基于先验知识各种方法要熟悉度量学习,类似降维这个就是迁移学习的思想,见多识广,学的比对的那个函数取代表性的点底层到应用层包已经把常见的范式内部集成了二、taskflow文本纠错,连个分类应用领域,文本,图像,语音句法分析结构可以用在数据增广上三、算子融合API调用算子,算子调用底层对应的cuda kernel减小往返的次数四、预训练微调新范式为何要小样本学习发展历程方法分类标准微调不太适合新范式,prom原创 2021-10-18 02:44:12 · 323 阅读 · 0 评论 -
paddlepadlde-paddlenlp换成自定义数据集本地加载更改步骤
一、自定义数据读取函数,并且做好读取配置,注意data_path这个参数必须对应好,名字和load_dataset保持一致 def read_out(data_path): """ pass """ with open(data_path, 'r', encoding='utf-8') as f: for line in f: line_stripped = line.strip().split('\t')原创 2021-10-17 13:40:01 · 990 阅读 · 0 评论 -
PaddleX就是一个restful-api协议转换的可视化工具而已
启动这个后就可以进入可视化的操作界面去操控服务器,进行模型的全流程开发,感觉有点就是代替xshell而已原创 2021-10-13 08:16:46 · 540 阅读 · 0 评论 -
paddle-serving docker部署,dockerfile一键打镜像,一键启动容器
一、服务端dockfile编写节省镜像空间,此处在python的镜像基础上构建,最终镜像2.38GFROM python:3.7.4COPY . /deployWORKDIR /deployRUN pip config set global.index-url https://mirror.baidu.com/pypi/simple \ && pip install --upgrade setuptools \ && pip install --原创 2021-10-10 19:58:50 · 929 阅读 · 0 评论 -
paddle-serving docker部署,非dockerfile,分步骤安装正确版本
镜像可以是同一个,下拉一次就好,创建不同的容器特别注意,paddleserving容器部署依赖的底层太多,一定要用官方的docker镜像源# 启动 CPU Dockerdocker pull registry.baidubce.com/paddlepaddle/serving:0.6.0-devel一:服务端容器serverdocker run -p 8090:8090 --name lazrad_pserver -dit registry.baidubce.com/paddlepaddle/s原创 2021-10-10 18:36:23 · 785 阅读 · 0 评论 -
Paddle Inference和Paddle Serving
部署方式服务器端高性能部署:将模型部署在服务器上,利用服务器的高性能帮助用户处理推理业务。模型服务化部署:将模型以线上服务的形式部署在服务器或者云端,用户通过客户端请求发送需要推理的输入内容,服务器或者云通过响应报文将推理结果返回给用户。移动端部署:将模型部署在移动端上,例如手机或者物联网的嵌入式端。Web端部署:将模型部署在网页上,用户通过网页完成推理业务。第一种方式这种方式,是整体打包,从本地移到服务器的部署,模型没有服务化,相对调用模型的函数,是本地调用的,这种方式效率快,不存在二次调度.原创 2021-10-10 17:51:30 · 1068 阅读 · 0 评论 -
paddle serving dockerfile
https://hub.fastgit.org/PaddlePaddle/Serving/tree/v0.6.0/toolsDocker 镜像(简体中文|English)该文档维护了 Paddle Serving 提供的镜像列表。获取镜像您可以通过两种方式获取镜像。通过 TAG 直接从 registry.baidubce.com 或 拉取镜像,具体TAG请参见下文的镜像说明章节的表格。docker pull registry.baidubce.com/paddlepaddle/serving:原创 2021-10-10 14:33:31 · 313 阅读 · 0 评论 -
PaddlePaddle batchify_fn
batchify_fn = lambda samples, fn=Dict({ 'input_ids': Pad(axis=0, pad_val=tokenizer.pad_token_id, dtype='int64'), # input 'token_type_ids': Pad(axis=0, pad_val=tokenizer.pad_token_type_id, dtype='int64'), # segment 'seq原创 2021-10-05 12:53:58 · 654 阅读 · 1 评论 -
paddle模型服务器部署分两步走
采用docker部署,将相关文件拷贝到容器中Serving readme执行命令后,会在当前目录下生成2个目录:serving_server 和 serving_client。serving_server目录包含服务器端所需的模型和配置,需将其拷贝到服务器端容器中;serving_client目录包含客户端所需的配置,需将其拷贝到客户端容器中。第一步 把动态图转换成静态图模型# Copyright (c) 2021 PaddlePaddle Authors. All Rights Reserved.原创 2021-08-11 17:26:28 · 1688 阅读 · 0 评论 -
baidu-aip python SDK快速入门文档查找位置
一定是在SDK里面,软件开发工具包,其他类似原创 2021-07-29 11:08:00 · 150 阅读 · 0 评论 -
Python调用百度API实现语音识别
Python调用百度API实现语音识别(一)前言上篇文章介绍了下如何用 Python 剪辑视频,想回顾的同学可以拉到文章最下面,有历史链接。有了上篇文章野狼disco的音频,今天就来带大家玩一下百度的API,如何借用百度 API 的语音识别功能,将我们的音频转为文字。最终落地到 word 中。当然,转为文字后,也为之前语音机器人做了铺垫,转换的文字可以写入到程序中,后续机器人朗读声音而用。百度 API 官网准备工作搜索开放能力 -> 语音技术 -> 语音识别可以看到这里有三种语音类型,点哪个都行原创 2021-07-29 11:02:49 · 5524 阅读 · 0 评论 -
DGU对话意图识别,每次模型只保存最佳模型
import osimport randomimport timeimport numpy as npfrom functools import partialimport paddleimport paddle.nn as nnimport paddle.nn.functional as Fimport paddle.distributed as distfrom paddle.io import DataLoader, DistributedBatchSampler, BatchSa原创 2021-07-27 14:23:14 · 321 阅读 · 0 评论 -
微信聊天机器人puppet_paimon token、puppet_padlocal token
os.environ[‘WECHATY_PUPPET’] = “wechaty-puppet-service”os.environ[‘WECHATY_PUPPET_SERVICE_TOKEN’] = “puppet_paimon_f3dabb5216d8826c681de77f85f18c07”这个token配置好后可以本地直接运行os.environ[‘WECHATY_PUPPET’] = “wechaty-puppet-service”os.environ[‘WECHATY_PUPPET_SER原创 2021-07-20 15:47:53 · 2203 阅读 · 0 评论 -
教你用AI Studio+wechaty+阿里云白嫖一个智能微信机器人
教你用AI Studio+wechaty+阿里云白嫖一个智能微信机器人前言这绝对是全网最细教程,没有之一右上角有Fork功能,还有点赞功能,你懂的项目展示1. 搞定云服务器部分我这里是用的阿里云的云服务器,你也可以用其他的比如腾讯云的、华为云的等等。1.1 注册一个阿里云账号并完成实名认证阿里云官网: https://account.aliyun.com/1.2 点击底部的免费试用1.3 点击右下角了解试用1.4 选择一款产品1.5 选择操作系统为Ubuntu, 点击原创 2021-07-20 15:01:50 · 1529 阅读 · 4 评论 -
SPO,关系抽取/实体关系抽取
每一个文字,属于N中关系,这N种关系对应关系头和关系尾,即使S还是O,所以有2 X N种选择,在加上I和O一共2 X N + 2种选择针对 DuIE2.0 任务中多条、交叠SPO这一抽取目标,比赛对标准的 ‘BIO’ 标注进行了扩展。 对于每个 token,根据其在实体span中的位置(包括B、I、O三种),我们为其打上三类标签,并且根据其所参与构建的predicate种类,将 B 标签进一步区分。给定 schema 集合,对于 N 种不同 predicate,以及头实体/尾实体两种情况,我们设计对应的原创 2021-07-16 17:44:11 · 1181 阅读 · 0 评论 -
addleNLP对于各种预训练模型已经内置了对于下游任务文本分类Fine-tune网络
不仅预训练模型有了,下游任务也集成进来了PaddleNLP一键加载预训练模型快递单信息抽取本质是一个序列标注任务,PaddleNLP对于各种预训练模型已经内置了对于下游任务文本分类Fine-tune网络。以下教程以ERNIE为预训练模型完成序列标注任务。paddlenlp.transformers.ErnieForTokenClassification()一行代码即可加载预训练模型ERNIE用于序列标注任务的fine-tune网络。其在ERNIE模型后拼接上一个全连接网络进行分类。paddlenlp原创 2021-07-16 17:21:25 · 244 阅读 · 0 评论 -
task-oriented dialogues 面向任务型对话综述
【原创】task-oriented dialogues 面向任务型对话综述 </h1> <div class="clear"></div> <div class="postBody"> <div id="cnblogs_post_body" class="blogpost-body blogpost-body-html">task-oriented对话系统主要是为解决特定任务的,比如订票任务(订机票,电影票等),预...原创 2021-07-16 16:19:03 · 1645 阅读 · 2 评论