基于一体化有序信息和事件关系的脚本事件预测

一、事件链

例如:
进餐馆---->点菜----->吃饭---->买单

二、模型LSTM

1.什么是LSTM模型?
LSTM模型是一种特别的RNN模型,比标准的 RNN 在很多的任务上都表现得更好。几乎所有的令人振奋的关于 RNN 的结果都是通过 LSTM 达到的。
2.什么是RNN模型?
RNN模型是神经网络的一种,英文名叫Recurrent Neural Networks。

三、简单介绍一下RNN神经网络

人是如何思考的?当你读一篇文章,你的大脑不可能从无开始思考,我们人类的思考是从已有的认知开始的,一篇文章的每个词我们都有自己的一个理解,就好比我们在自己的脑中对这个词有了一个初值。但这个初值是经过筛选的,例如你看到‘苹果’这个词,我们选择记忆的是‘手机’,‘水果’。。。。然后其他与‘’苹果‘’无关的词,我们就选择遗忘。
传统的神经网络并不能做到这点。例如,柯南中的一个事件里面的线索,传统的神经网络很难将每一个线索事件联系起来,然后推测下一个事件
RNN 解决了这个问题。RNN 是包含循环的网络,允许信息的持久化。
在这里插入图片描述
在上面的示例图中,神经网络的模块A,正在读取某个输入 X t X_t Xt ,并输出一个值 h t h_t ht。循环可以使得信息可以从当前步传递到下一步。
但是RNN存在一个长期依赖(Long-Term Dependencies)问题
在一个语句中,我们通过前文来推断当前的词。例如 “the color of apple is___” 最后的词,我们并不需要任何其他的上下文,因此下一个词很显然就应该是 red。在这样的场景中,相关的信息和预测的词位置之间的间隔是非常小的,RNN 可以学会使用先前的信息。

在这里插入图片描述

但如果相关词距离预测位置太远了,RNN 会丧失学习到连接如此远的信息的能力。
在理论上,RNN 绝对可以处理这样的 长期依赖问题。但是实际上,很难。
所以就出现了LSTM。

四、简单了解LSTM

LSTM分为三层,输入层,遗忘门,输出门
为了获得长期依赖的能力。LSTM相对RNN进行了一个局部升级:
在这里插入图片描述
RNN是这样的:
在这里插入图片描述
在这里插入图片描述

五、事件预测流程

1.数据表示

给出一系列叙述事件e1, e2, …, en−1,我们的目的是预测下一个事件en。
事件e的结构为v(a0,a1,a2)
例如: bring{John, Marry, to the restaurant}

2.大致思想

使用语法分析器和命名实体解析器从文本语料库中提取事件。利用神经网络对提取的事件链进行建模,用于脚本学习。
特别是,在给定一系列事件的情况下,我们对后续事件的概率进行了建模。我们解决了多重选择的叙事完形填空任务:给定一系列事件和一组候选。

3.事件表达(这一步就是对事件的预处理,将文字转换为数字)

我们通过对标准事件的动词和参数进行预先训练的单词嵌入来学习标准事件的向量表示。对于包含多个单词的参数,我们使用平均值来表示。对于小于3个参数的事件,例如“john fell”,其中v=fall,a0=john,a1=null,a2=null,空参数使用全零向量表示。将v、a0、a1和a2的嵌入表示为e(V)、e(a0)、e(a1)和e(a2)。分别用tanh组成层计算了e的嵌入量。
在这里插入图片描述
W e v , W e 0 , W e 1 , W e 2 , b e W_e^v,W_e^0,W_e^1,W_e^2,b_e Wev,We0,We1,We2,be是参数
3.时序建模
我们通过LSTM神经网络,得到每个事件的隐藏层 h i h_i hi,也就是上面输出的 h i h_i hi
h i = L S T M ( e ( e i ) , h i − 1 ) h_i=LSTM(e(e_i),h_{i-1}) hi=LSTM(e(ei),hi1),h有一个初值 h S h_S hS
在这里插入图片描述上图中 e c 1 , e c 2 . . . e_{c1},e_{c2}... ec1,ec2...是时间链的候选,我们可以通过求h的式子得到每个候选事件的h,这个h就是之后被用作估计相应事件候选对象的概率的基础。

4.事件对建模

在获取事件的隐状态后,利用这些隐藏状态向量对事件关系进行建模。一个简单的方法来模拟两个事件之间的关系。现有 h i h_i hi h c h_c hc,给定一对事件 h i h_i hi(i∈[1.n−1])和 h c h_c hc,关联评分由下式得:
在这里插入图片描述
W s i , W s c , b S W_{si},W_{sc},b_S Wsi,Wsc,bS是参数,这是一个一对多的过程,一个候选事件对于前面每个事件都会有个关联评分,最终我们由:
在这里插入图片描述
可以得到这个候选时间对于这条时间链的评分,式子3就是求了个平均
但是啊!!!!平均对于我们来说是远远不够的,每个事件对于候选事件的贡献度是不同的。例如,考虑到“排队等候”、“就坐”和“点餐”等事件,与其他两个事件相比,“点餐”更适用于推断“吃的食物”。另外两件事。给定整个事件链上的信息,这个链接可能更明显,因为该场景可能是餐馆访问。所以我们需要对现有事件进行加权。

加权

我们使用一个注意神经网络来计算每个现存事件的相对重要性
在这里插入图片描述
最终 a i a_i ai h i h_i hi的权值
在这里插入图片描述
式子6就是加权后的每个候选事件对于事件链的关联评分】

基于深度记忆网络的多层关注

这种方法已经被用来探索语义任务的深层语义信息。例如回答问题
深层语义信息是进行最合理推理所必需的一种感觉。因此,我们被激励使用一个深记忆网络模型来细化事件权重和事件关系。通过递归地对场景的更抽象的表示进行建模来进行计算。与以往的研究不同,我们使用记忆网络对事件链进行建模,细化了对事件链的关注。探讨事件之间的成对关系
在这里插入图片描述
h i h_i hi是现有事件链的隐藏变量, v t v_t vt是上下文事件与候选事件之间的语义表示。 a t a_t at是上下文事件的权重。
现有事件 e 1 , e 2 . . . e n − 1 e_1,e_2...e_{n-1} e1,e2...en1的权重,可以使用相同的计算。给定权重α,我们将上下文事件链 e 1 、 e 2 、 . 、 e n − 1 e_1、e_2、.、e_{n−1} e1e2.en1的合并表示为 h 1 、 h 2 、 . 、 h n − 1 h_1、h_2、.、h_{n−1} h1h2.hn1的加权和:
在这里插入图片描述
候选事件 h c h_c hc和现有链的新表示他可以进一步集成,从而推导出整个事件链假设的更深层次表示,与 h c h_c hc相比,v包含更深层次的语义信息,它编码事件链的时间顺序 [ h 1 , h 2 . . h n − 1 , h c ] [h_1,h_2..h_{n−1},h_c] [h1h2..hn1,hc],而不区分每个事件的权重。作为结果表明,在下一跳中,通过使用v代替 h c h_c hc来计算关联度,可以得到更好的事件权重。
在这里插入图片描述
在这里插入图片描述
同样,我们还可以多次重复这些步骤,这样就可以根据现有事件的链提取更多的抽象证据。递归地使用 h c h_c hc作为初始场景表示形式 v 0 v_0 v0,然后重复计算 h e t h^t_e het给定 h 1 , h 2 , . , h n − 1 和 v t h_1,h_2,.,h_{n−1}和v_t h1h2.hn1vt,并使用 h e t h^t_e het v t v_t vt找到更深层次的场景报告。 为此目的,使用了门控递归网络。
在这里插入图片描述
后面这个深层次的看的不是很懂

最后有关的数学式子

在这里插入图片描述
2.

3.
在这里插入图片描述

[编辑本段]Turbo C2.0    介绍      Turbo C2.0不仅是一个快捷、高效的编译程序,同时还有一个易学、易用的集成开发环境。使用Turbo C2.0无需独立地编辑、编译和连接程序,就能建立并运行C语言程序。因为这些功能都组合在Turbo 2.0的集成开发环境内,并且可以通过一个简单的主屏幕使用这些功能。    基本配置要求   Turbo C 2.0可运行于IBM-PC系列微机,包括XT,AT及IBM 兼容机。此时要求DOS2.0或更高版本支持,并至少需要448K的RAM,可在任何彩、单色80列监视器上运行。支持数学协处理器芯片,也可进行浮点仿真,这将加快程序的执行。 [编辑本段]Turbo C 2.0的主要文件的简单介绍   INSTALL.EXE 安装程序文件   TC.EXE 集成编译   TCINST.EXE 集成开发环境的配置设置程序   TCHELP.TCH 帮助文件   THELP.COM 读取TCHELP.TCH的驻留程序README 关于Turbo C的信息文件   TCCONFIG.EXE 配置文件转换程序MAKE.EXE   项目管理工具TCC.EXE   命令行编译TLINK.EXE   Turbo C系列连接器TLIB.EXE   Turbo C系列库管理工具C0?.OBJ 不   同模式启动代码C?.LIB   不同模式运行库GRAPHICS.LIB   图形库EMU.LIB   8087仿真库FP87.LIB 8087库   *.H Turbo C头文件   *.BGI 不同显示器图形驱动程序   *.C Turbo C例行程序(源文件)   其中:上面的?分别为:T Tiny(微型模式)S Small(小模式)C Compact(紧凑模式)M Medium(中型模式)L Large(大模式)H Huge(巨大模式)    Turbo C++ 3.0   “Turbo C++ 3.0”软件是Borland公司在1992年推出的强大的——C语言程序设计与C++面向对象程序设计 的集成开发工具。它只需要修改一个设置选项,就能够在同一个IDE集成开发环境下设计和编译以标准 C 和 C++ 语法设计的程序文件。 [编辑本段]C 语言   C语言起始于1968年发表的CPL语言,它的许多重要思想都来自于Martin Richards在1969年研制的BCPL语言,以及以BCPL语言为基础的与Ken Thompson在1970年研制的B语言。Ken Thompson用B语言写了第一个UNIX操作系统。M.M.Ritchie1972年在B语言的基础上研制了C语言,并用C语言写成了第一个在PDP-11计算机上研制的UNIX操作系统。1977年出现了独立于极其的C语言编译文本《看移植C语言编译程序》,从而大大简化了把C语言编译程序移植到新环境中所做的工作,这本身也就使UNIX的日益广泛使用,C语言也迅速得到推广。   1983年美国国家标准化协会(ANSI)根据C语言问世以来的各种版本,对C语言的发展和扩充制定了新的标准,成为ANSI C。1987年ANSI又公布了新标准————87ANSI C。   目前在微型计算机上使用的有Microsoft C、Quick C、Turbo C等多种版本。这些不同的C语言版本,基本部分是相同的,但是在有关规定上有略有差异。   C 语言发展如此迅速, 而且成为最受欢迎的语言之一, 主要因为它具有强大的功能。许多著名的系统软件, 如DBASE Ⅲ PLUS、DBASE Ⅳ 都是由C 语言编写的。用C 语言加上一些汇编语言子程序, 就更能显示C 语言的优势了,象PC- DOS ,WORDSTAR等就是用这种方法编写的。归纳起来C 语言具有下列特点:   1. C是中级语言   它把高级语言的基本结构和语句与低级语言的实用性结合起来。C 语言可以象汇编语言一样对位、字节和地址进行操作, 而这三者是计算机最基本的工作单元。   2. C是结构式语言   结构式语言的显著特点是代码及数据的分隔化, 即程序的各个部分除了必要的信息交流外彼此独立。这种结构化方式可使程序层次清晰, 便于使用、维护以及调试。C 语言是以函数形式提供给用户的, 这些函数可方便的调用, 并具有多种循环、条件语句控制程序流向, 从而使程序完全结构化。   3. C语言功能齐全   C 语言具有各种各样的数据类型, 并引入了指针概念, 可使程序效率更高。另外C 语言也具有强大的图形功能, 支持多种显示器和驱动器。而且计算功能、逻辑判断功能也比较强大, 可以实现决策目的。   4. C语言适用范围大   C 语言还有一个突出的优点就是适合于多种操作系统, 如DOS、UNIX,也适用于多种机型。   C语言的优点很多,但是也存在一些缺点,如运算优先级太多,运算能力方面不像其它高级语言那样强,语法定义不严格等。但是这些都不能阻止C语言成为一门广受欢迎的计算机编程语言
Turbo C2.0 介绍   Turbo C2.0不仅是一个快捷、高效的编译程序,同时还有一个易学、易用的集成开发环境。使用Turbo C2.0无需独立地编辑、编译和连接程序,就能建立并运行C语言程序。因为这些功能都组合在Turbo 2.0的集成开发环境内,并且可以通过一个简单的主屏幕使用这些功能。 基本配置要求   Turbo C 2.0可运行于IBM-PC系列微机,包括XT,AT及IBM 兼容机。此时要求DOS2.0或更高版本支持,并至少需要448K的RAM,可在任何彩、单色80列监视器上运行。支持数学协处理器芯片,也可进行浮点仿真,这将加快程序的执行。 主要文件的简单介绍   INSTALL.EXE 安装程序文件   TC.EXE 集成编译   TCINST.EXE 集成开发环境的配置设置程序   TCHELP.TCH 帮助文件   THELP.COM 读取TCHELP.TCH的驻留程序README 关于Turbo C的信息文件   TCCONFIG.EXE 配置文件转换程序MAKE.EXE   项目管理工具TCC.EXE   命令行编译TLINK.EXE   Turbo C系列连接器TLIB.EXE   Turbo C系列库管理工具C0?.OBJ 不   同模式启动代码C?.LIB   不同模式运行库GRAPHICS.LIB   图形库EMU.LIB   8087仿真库FP87.LIB 8087库   *.H Turbo C头文件   *.BGI 不同显示器图形驱动程序   *.C Turbo C例行程序(源文件)   其中:上面的?分别为:T Tiny(微型模式)S Small(小模式)C Compact(紧凑模式)M Medium(中型模式)L Large(大模式)H Huge(巨大模式)
### 回答1: 在 TURBO C 2.0 中,您可以使用 biosdisk() 函数来格式化软盘。 下面是一段代码示例: ``` #include <stdio.h> #include <dos.h> int main() { // 定义扇区的大小 unsigned int sector_size[3] = {512, 512, 1024}; // 定义填充字节 unsigned char fill_char[3] = {0xF6, 0xF6, 0x48}; // 格式化磁道 700 的前三个扇区 for (int i = 0; i < 3; i++) { int result = biosdisk(2, 0, 70, 0, i + 1, 1, sector_size[i], fill_char[i]); if (result != 0) { printf("格式化扇区 %d 失败,返回码: %d\n", i + 1, result); } } return 0; } ``` 请注意,在使用 biosdisk() 函数之前,需要包含 dos.h 头文件。 希望这能帮到您! ### 回答2使用TURBO C 2.0语言,可以通过以下代码格式化软盘的70磁道0面,并分别格式化3个扇区,大小分别为512字节、512字节和1024字节。其中,前两个扇区使用F6填充,第三个扇区使用48填充。 ```c #include<stdlib.h> #include<stdio.h> #include<dos.h> void formatFloppyDisk(){ union REGS regs; regs.h.ah = 0x0;// To format a floppy disk, we set AH=0 regs.h.dl = 0;// Drive number (0=A, 1=B, etc.) regs.x.cx = 0;// Track number to format regs.h.dh = 0;// Head number regs.h.al = 0;// Sector size (0=default, 1=512 bytes, 2=1024 bytes, 3=2048 bytes etc.) int FILL_BYTE = 0;// The byte value to fill the sectors with during formatting int NUM_SECTORS = 3;// Number of sectors to format // To format 70th track 0th head regs.x.ax = 0x1301; // 0x13 = Reset disk system, 01H = Reset only specified drive int86(0x13, &regs, &regs); // BIOS interrupt to reset disk system for (int i=0; i<NUM_SECTORS; i++){ regs.x.ax = 0x3101; // 0x31 = Write Format, 01H = Format only current track regs.x.bx = 0x0001; // 0x00 = Drive A:, 01H = Head 1, 0 = Generate ID Field depending on the disk in the drive 1 = Keep the ID Field all zeros regs.x.cx = 0x0170; // Track number=70(0-79 range) regs.h.dh = 0x00; // Head number=0 or 1 regs.h.al = 0x02; // Control byte=always zero regs.x.dx = i+1; // Sector number starting from 1 regs.x.si = 0x0000; // segment and offset of read/write buffer regs.x.di = 0x0000; // segment and offset of result if(i == 2){ FILL_BYTE = 0x48; // Fill the third sector with 48 regs.x.ax = 0x3102; // 0x31 = Write Format, 02H = Format sequential tracks immediately following the one being formatted }else{ FILL_BYTE = 0xF6; // Fill the first two sectors with F6 } regs.h.ah = FILL_BYTE; // Fill the sector with specified byte int86(0x13, &regs, &regs); // BIOS interrupt to format the specified sector } } int main(){ formatFloppyDisk(); return 0; } ``` 上述代码使用了INT 0x13,即BIOS中断服务例程,来执行软盘格式化操作。通过设置寄存器的不同参数,可以指定要格式化的磁道、面、扇区大小和填充字节。在这个例子中,我们格式化了软盘70磁道0面的3个扇区,前两个扇区使用F6填充,第三个扇区使用48填充。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值