paddlepaddle学习

最新推荐文章于 2024-04-28 11:07:19 发布

梦无痕123

最新推荐文章于 2024-04-28 11:07:19 发布

阅读量1.2k

点赞数

分类专栏：随笔文章标签： paddlepaddle 百度人工智能

本文链接：https://blog.csdn.net/lb521200200/article/details/122722496

版权

随笔专栏收录该内容

43 篇文章 1 订阅

订阅专栏

假期会好好学习下，今天看了一点入门

百度AI Studio课程_学习成就梦想，AI遇见未来_AI课程 - 百度AI Studio - 人工智能学习与实训社区

安装

# 安装所需的py包

pip install paddle2onnx==0.8.2

pip install onnx==1.9.0

pip install onnxruntime-gpu==1.4.0

pip install ppqi==1.0.4

简单测试程序：

加载字典的古典诗词

import paddlenlp
test_dataset, dev_dataset, train_dataset = paddlenlp.datasets.load_dataset('poetry', splits=('test','dev','train'), lazy=False)
print('test_dataset 的样本数量：%d'%len(test_dataset))
print('dev_dataset 的样本数量：%d'%len(dev_dataset))
print('train_dataset 的样本数量：%d'%len(train_dataset))
print('单样本示例：%s'%test_dataset[0])

import re
def data_preprocess(dataset):
    for i, data in enumerate(dataset):
        dataset.data[i] = ''.join(list(dataset[i].values()))
        dataset.data[i] = re.sub('\x02', '', dataset[i])
    return dataset

# 开始处理
test_dataset = data_preprocess(test_dataset)
dev_dataset = data_preprocess(dev_dataset)
train_dataset = data_preprocess(train_dataset)
print('处理后的单样本示例：%s'%test_dataset[0])

#加载分词器
from paddlenlp.transformers import BertTokenizer

bert_tokenizer = BertTokenizer.from_pretrained('bert-base-chinese')

后续好好学习下自然语言处理 — PaddleEdu documentation (paddlepedia.readthedocs.io)

梦无痕123

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
paddlepaddle学习

假期会好好学习下，今天看了一点入门百度AI Studio课程_学习成就梦想，AI遇见未来_AI课程 - 百度AI Studio - 人工智能学习与实训社区安装# 安装所需的py包pip install paddle2onnx==0.8.2pip install onnx==1.9.0pip install onnxruntime-gpu==1.4.0pip install ppqi==1.0.4简单测试程序：加载字典的古典诗词import paddlenlptes
复制链接

扫一扫

专栏目录