[NLG]Few-Shot Dialogue Generation Without Annotated Data: A Transfer Learning Approach

总述:

  我觉得这篇论文的主要亮点就是不要标注数据。之前赵天成的zero-shot虽然很惊艳,但是迫于每一句话都需要标注dialogu action,所以应用性不强。这篇论文就是结合了赵天成之前的两篇工作,第一个zero-shot,第二个laed(用于在大规模数据中学习找到对话潜在的latent action)。然后作者就认为,在大规模无标签对话中用laed学习可以学到隐式的dialog action。

主要模型:

右图是他的主要模型,上面部分就是说其实就是训练了LAED和部分的ZSDG(只含有dialogue context部分),然后把它们的hidden连接起来,去生成。主要公式如下。k是表示融合了一些外部知识,c是对话上文的历史,d是domain,模型的外部知识片段就直接连在对话历史后面了(又是玄学操作)。

然后他的loss就只有ZSDGloss的一部分,也就是:

主要的训练过程:先用大规模无标注数据训练LAED,然后再target domain里面随机选取一些(1%--10%)对话作为seed data,然后这些seed对话经过LAED之后的hidden就相当于ZSDG里面的dialog action了。(话说,感觉这个过程不太靠谱,这不直接把测试集的答案告诉LAED了吗?还要训练吗QAQ)

一句话总结:

   在ZHAO的两篇工作的基础上,融合了外部知识,通过LAED预训练大规模数据用来代替数据的标注,在不需要数据标注的情况下实现了few-shot dialogue生成的最好效果。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
%Matlab程序读取sst数据: close all clear all oid='sst.mnmean.nc' sst=double(ncread(oid,'sst')); nlat=double(ncread(oid,'lat')); nlon=double(ncread(oid,'lon')); mv=ncreadatt(oid,'/sst','missing_value'); sst(find(sst==mv))=NaN; [Nlt,Nlg]=meshgrid(nlat,nlon); %Plot the SST data without using the MATLAB Mapping Toolbox figure pcolor(Nlg,Nlt,sst(:,:,1));shading interp; load coast;hold on;plot(long,lat);plot(long+360,lat);hold off colorbar %Plot the SST data using the MATLAB Mapping Toolbox figure axesm('eqdcylin','maplatlimit',[-80 80],'maplonlimit',[0 360]); % Create a cylindrical equidistant map pcolorm(Nlt,Nlg,sst(:,:,1)) % pseudocolor plot "stretched" to the grid load coast % add continental outlines plotm(lat,long) colorbar % sst数据格式 % Variables: % lat % Size: 89x1 % Dimensions: lat % Datatype: single % Attributes: % units = 'degrees_north' % long_name = 'Latitude' % actual_range = [88 -88] % standard_name = 'latitude_north' % axis = 'y' % coordinate_defines = 'center' % % lon % Size: 180x1 % Dimensions: lon % Datatype: single % Attributes: % units = 'degrees_east' % long_name = 'Longitude' % actual_range = [0 358] % standard_name = 'longitude_east' % axis = 'x' % coordinate_defines = 'center' % % time % Size: 1787x1 % Dimensions: time % Datatype: double % Attributes: % units = 'days since 1800-1-1 00:00:00' % long_name = 'Time' % actual_range = [19723 74083] % delta_t = '0000-01-00 00:00:00' % avg_period = '0000-01-00 00:00:00' % prev_avg_period = '0000-00-07 00:00:00' % standard_name = 'time' % axis = 't' % % time_bnds % Size: 2x1787 % Dimensions: nbnds,time % Datatype: double % Attributes: % long_name = 'Time Boundaries' % % sst % Size: 180x89x1787 % Dimensions: lon,lat,time % Datatype: int16 % Attributes: % long_name = 'Monthly Means of Sea Surface Temperature' % valid_range = [-5 40] % actual_range = [-1.8 36.08] % units = 'degC' % add_offset = 0 % scale_factor = 0.01 % missing_value = 32767 % precision = 2 % least_significant_digit = 1 % var_desc = 'Sea Surface Temperature' % dataset = 'NOAA Extended Reconstructed SST' % level_desc = 'Surface' % statistic = 'Mean' % parent_stat = 'Mean' 解释这个代码的意思,并将其转换为python代码
最新发布
07-11

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值