山东大学软件工程应用与实践----SENTA代码分析（三）

最新推荐文章于 2024-09-26 19:15:00 发布

ZeYuyyyy

最新推荐文章于 2024-09-26 19:15:00 发布

阅读量135

点赞数

文章标签： python

本文链接：https://blog.csdn.net/qq_46189653/article/details/121079776

版权

2021SC@SDUSC

分析data文件夹中的代码内容

data文件夹下面又有data-set-reader field-reader tokenizer 三个文件夹

BaseDataSetReader:将样本中数据组装成一个py_reader, 向外提供一个统一的接口。
核心内容是读取明文文件，转换成id，按py_reader需要的tensor格式灌进去，然后通过调用run方法让整个循环跑起来。
py_reader拿出的来的是lod-tensor形式的id，这些id可以用来做后面的embedding等计算。

必须选项，否则会抛出异常。
用于初始化self.paddle_py_reader。

实例化fields_dict, 调用pyreader，得到fields_id, 视情况构造embedding，然后结构化成dict类型返回给组网部分。

实例化的dict，保存了各个field的id和embedding(可以没有，是情况而定), 给trainer用.

数据生成器：读取明文文件，生成batch化的id数据，绑定到py_reader中

而剩下两种则是ernie 和Roberta两种模型来进行训练这部分下一章再进行分析

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ZeYuyyyy

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

2021SC@SDUSC-山东大学软件工程与实践-Senta(十一总结)

Casterrrrrrrr的博客

12-31

633

本篇为软件工程与实践课程SENTA项目分析的最后一篇，对SENTA进行调用并进行总结。调用代码段： import paddlehub as hub senta = hub.Module(name="senta_bilstm") test_text = [ "这个宾馆比较陈旧了，特价的房间也很一般。总体来说一般", "交通方便；环境很好；服务态度很好房间较小", "稍微重了点，可能是硬盘大的原故，还要再轻半斤就好了。" , "服务很不错，下次还会来。" , "前

2021SC@SDUSC-山东大学软件工程与实践-Senta(2)

Casterrrrrrrr的博客

11-30

1005

Senta中的语义表示模型ERNIE 知识增强的语义表示模型 ERNIE（Enhanced Representation through kNowledge IntEgration）通过对词、实体等语义单元的掩码，使得模型学习完整概念的语义表示。相较于 BERT 学习原始语言信号，ERNIE 直接对先验语义知识单元进行建模，增强了模型语义表示能力。在本次的百度Senta项目中，语义表示模型使用的就是ERNIE。在本篇以及下一篇代码分析中，我将以ERINIE作为预训练模型进行Fine-tune,使用的数据集

参与评论您还未登录，请先登录后发表或查看评论

PaddlePaddle入门02：数据准备

qq_41924191的博客

09-06

874

根据《90分钟PaddlePaddle快速上手》整理。概念： Batch：多个样本数据组成的一份训练（预测）数据称为batch。每个batch包含的样本数量称为batch_size Epoch：每次便利全体数据集进行训练（预测）的过程称为一轮epoch 数据增强训练神经网络的有效手段，增强方式：Shuffle、随机裁剪、图像反转、光照色彩变换、随机加噪… 步骤自定义数据读取reader 读取...

8、滤波器【入门软件无线电（SDR）】PySDR：使用 Python 的 SDR 和 DSP 指南

yuuuuuuuk的博客

04-08

1072

滤波器【入门软件无线电（SDR）】PySDR：使用 Python 的 SDR 和 DSP 指南

6、USRP【入门软件无线电（SDR）】PySDR：使用 Python 的 SDR 和 DSP 指南

yuuuuuuuk的博客

03-13

2210

4、USRP【入门软件无线电（SDR）】PySDR：使用 Python 的 SDR 和 DSP 指南

关于python中的阅读器reader的理解

HelloWorld

08-26

8571

import csv filename = 'sitka_weather_07-2014.csv' with open(filename) as f: reader = csv.reader(f) header_row = next(reader) print(header_row) 导入模块csv之后，我们将要使用的文件的名称存储在filename中。接下来，我们打...

Python软件无线电（1）：概述

二向箔

09-15

1414

Senta-master.zip

03-08

《Senta：百度开源情感分析系统的深度解析》在当今信息爆炸的时代，...通过深入学习Senta的源代码和实践应用，我们可以更好地理解和掌握情感分析的原理，同时也能为我们的项目带来更智能、更人性化的文本处理能力。

山东大学软件工程实验报告及作业

02-22

标题中的“山东大学软件工程实验报告及作业”表明这是一份与山东大学计算机科学或软件工程专业相关的学习材料，可能包含学生在课程中完成的实验报告和作业内容。描述中提到的“1.项目是数据库课设做的火车票售票系统...

play-scala-streaming-example：示例Play应用程序，显示Scala中的Comet和Server Sent事件

02-06

**Play Framework Scala 流处理与 Comet 和 Server Sent Events 示例** Play Framework 是一个开源的Web应用框架，基于Java和Scala，采用MVC（Model-View-Controller）架构模式。在这个特定的示例`play-scala-...

RTL-SDR-Python-Signal-Processing:使用RTL-SDR USB加密狗的实验DSP Python脚本

03-10

RTL-SDR-Python-信号处理使用RTL-SDR USB加密狗的实验DSP Python脚本驱动安装视窗：故障排除 --->某些操作系统（Linux，OS X）在执行小读取时似乎会导致libusb缓冲区问题。如果遇到问题，请尝试一次读取1024个（或2的高次方）个样本。 --->如果您遇到librtlsdr导入错误：视窗：确保所有librtlsdr DLL文件（librtlsdr.dll，libusb-1.0.dll）都在您的系统路径中，或者与此自述文件位于同一文件夹中。还要确保您拥有所有它们的依赖项（例如libgcc_s_dw2-1.dll或可能的Visual Studio运行时文件）。如果rtl_sdr.exe有效，那么您应该可以。还要注意，您不能将64位版本的Python与32位版本的librtlsdr混合使用，反之亦然。在librtlsdr.py

Python-gsmsmssdr使用sdr嗅探gsm短信GSM在中国是没有加密的

08-10

gsmsms_sdr 使用sdr嗅探gsm短信，GSM在中国是没有加密的

一大堆的SDR软件，

热门推荐

kc87654321的专栏

09-29

4万+

爱不交租 2015-12-06 23:31 一大堆的SDR软件，此帖有剧毒！严正声明：解药不要找我.... 先记号，有空慢慢看 http://www.sdr-j.tk/index.html 爱不交租 2015-12-06 23:48 http://sdr.ipip.cz/software 再记号一个

HDR和SDR区别

萧戈的专栏

04-03

4万+

这东西没那么容易解释的清。。。HDR和SDR是两套亮度/色度体系，就像别人用英语说一个interesting，然后你非按中文翻译成了因垂思婷一、为啥变灰了：变灰表现在：亮度降低+颜色饱和度下降。这是因为HDR有自己的颜色范围和亮度范围。如果把HDR当成SDR窄亮度，窄色域来渲染，颜色自然就不对了。打个比方，视频编码一般用0和1代表最暗和最亮。HDR中亮度范围（0-1），代表0.0001到10...

SDR 软件无线电

timewh的专栏

06-27

1344

http://gnuradio.microembedded.com/ http://mirrors.163.com/ https://www.expreview.com/69419.html http://www.doc88.com/p-9863419341526.html https://www.cnblogs.com/jsdy/p/11803790.html 在使用pip安装pybomb...

限流 -- Sentinel 相关实现原理学习总结

井底之蛙

08-25

6014

简介 Sentinel 是什么？随着微服务的流行，服务和服务之间的稳定性变得越来越重要。Sentinel 以流量为切入点，从流量控制、熔断降级、系统负载保护等多个维度保护服务的稳定性。官方地址：https://github.com/alibaba/Sentinel/ Sentinel 具有以下特征: 丰富的应用场景：Sentinel 承接了阿里巴巴近 10 年的双十一大促流量的核心场...

玩弄SDR的历程（一）——我对SDR的大致理解

weixin_41352026的博客

01-24

2万+

笔者注：（1）由于本学期注册博客困难重重，所以等到学期末才把写的东西按章节贴上来，望谅解。（2）本人是电子科技大学2017级信息与通信工程学院本科生，本学习历程参考了Mathwork的官网和以下书目，纯属学习使用，无商业用途。【撰写日期：2017.10.1】--------------------------------------------------------

VeighNa：强大的Python开源量化交易平台