自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 CSC近年论文分析总结

中文拼写纠错近年方法总结

2022-01-31 00:21:40 324

原创 论文慢递4:CSC论文分享_PointerNetwork_ACL2019

Confusionset-guided Pointer Networks for Chinese Spelling Check背景主要方法encoderdecoder实验结果结论讨论背景CSC很重要;任务存在特殊性,与MT等生成式不同,输入与输出大部分相同;因此生成策略如下:copy输入从混淆集选择(相比词表减少搜索空间)主要方法seq2seq架构;encoder采用一个双向LSTM进行编码hjs=BiLSTM(hi−1s,eis)h_j^s=BiLSTM(h_{i-1}^s,e

2022-01-23 01:33:23 775

原创 论文慢递3: CSC论文分享_FASPell_EMNLP2019

目录FASPell(EMNLP2019)背景主要方法DAE部分decoder部分数据集相似度筛选方案实验结果结论FASPell(EMNLP2019)背景目前方法存在的问题:过拟合匮乏的中文拼写错误数据集依赖存在缺陷且不灵活的混淆集判断相似性本文贡献:提出一个用于CSC的新框架:DAE-decoder提出一种更精确的描述单词相似性的方法提出一个实践有效的解码方案提高召回关于标题:FastAdaptableSimplePowerful主要方法结构图DAE部分鉴于

2022-01-21 23:41:25 1124

原创 论文慢递2:PLOME: Pre-training with Misspelled Knowledge for Chinese Spelling Correction

目录abstract方法模型结构基于混淆集的掩码策略嵌入层Encoder层Output层训练方法finetuneabstract将拼写错误知识加入到预训练掩码语言模型,使用修正混淆集来代替预测掩码,加入语音级和字形级信息来辅助模型学习纠错;方法模型结构将拼音与笔画加入embedding层辅助基于混淆集的掩码策略相较于bert直接MASK,采用混淆集辅助MASK,通过形近和音近字进行掩码使模型纠错有的放矢;除此之外,为了增加模型鲁棒性,还有概率进行随机掩码;为了防止模型总是倾向于纠错,也有概

2021-09-06 23:54:32 816 1

原创 论文慢递1:Combining Self-Training and Self-Supervised Learning for Unsupervised Disfluency Detection

目录前言模型方法伪数据训练teacher模型伪数据训练grammaticality judgment模型训练student模型实验&实验结果英文(作者)数据集介绍dev集上结果test集上结果select消融实验中文(复现)伪数据的构造目前的结果总结前言当前文本顺滑任务基于昂贵的标注语料,本文提出了一种基于半监督的noise student training方法可以通过无标注语料进行学习,且结果与当前的有监督模型(Bert、Electra)相比表现也有一定竞争性;ASR任务中的输出结果往往

2021-09-04 16:14:57 267 1

原创 vim常用总结

用一点写一点目录基本匹配查找参考基本保存退出ZZ不保存强制退出ZQ匹配查找查询:%s/pattern//gn% - 指明操作区间,%表示全文本;可以使用1,$或者行区间代替s – substitute,表示替换pattern - 要查找的字符串// - 替代文本应该放在这里,两个斜杠中间没有任何字符表示无替代文本g – Replace all occurences in the line. Without this argument, replacement oc.

2021-09-02 20:18:04 126 1

原创 2019机器学习试题及个人思路

仅供参考,如有错误请指正1. 信息增益的定义,信息增益的好处?决策树决策面是否为线性,举例说明。信息增益是集合D的经验熵H(D)与特征A给定条件下D的经验条件熵H(D|A)之差:g(D,A)=H(D)−H(D∣A)g(D,A)=H(D)-H(D|A)g(D,A)=H(D)−H(D∣A)一般也将熵与条件熵的差值叫做互信息,决策树学习中的信息增益等价于训练数据集中的类和特征的互信息。互信息表示由于特征A使数据集D分类的不确定性减少的程度,因此互信息高的特征有更强的分类能力。依此决策能够有很好的分类.

2020-11-21 00:43:56 490 5

原创 信息熵&互信息相关推导

目录前言信息熵互信息互信息的等式关系互信息的性质前言信息熵互信息互信息的等式关系互信息的性质

2020-09-19 00:53:24 2936 2

原创 finally是否执行的思考

目录特殊情况特殊情况finally的常规使用我不再赘述,就是在try或catch后会继续class Indecisive { public static void main(String[] args) { System.out.println(decision()); } static boolean decision() { try { return true; } finally { return false; }

2020-07-11 00:43:15 137

原创 对instanceof的思考

目录从instanceof的特殊情况说起基本原理思想对强转的解释从instanceof的特殊情况说起在阅读相关课件时,发现了一个有趣的注释:“避免使用instanceof子类”。因此我做了一个小实验,对于父类和子类互相instanceof查看结果:子类 instanceof 父类 == true父类 instanceof 子类 == false除此之外,instanceof也不需要进行null检查。这些特性让人不禁好奇,其具体的实现原理。基本原理思想查阅相关资料,得到了一个如下思路的代码

2020-07-06 22:33:31 264

原创 双向委托,一种可复用的新思路(二)Observer模式

这里写自定义目录标题与Visitor模式的比较从“买房”说起观察者模式的本质结构Java中的Observer接口和Observable抽象类源码应用被观察者,继承抽象类观察者,实现接口与Visitor模式的比较之前我们讨论了Visitor模式,作为课程学习中唯一一个接口层面的双向委托,它将数据和操作清晰的分离开来,大大提高了可复用性。本次我们讨论对于具体实现的双向委托Observer模式,也作为一个高内聚低耦合的模式,能够建立一种对象和多个对象的联系,并且易于修改,可复用性极强。从“买房”说起Obs

2020-05-26 20:13:11 231

原创 java中的多种比较方式的实现

目录java中的比较Comparable接口和compareTo方法Comparator接口和compare方法java中的比较java中常用的比较方式有一下三种:重写equals方法进行比较继承Comparable接口,并实现compareTo方法定义一个单独的对象比较器,继承自Comparator接口,实现compare方法第一种方法之前已经考虑过,这次只探究后两种以及对排序的...

2020-05-17 17:22:23 425

原创 双向委托,一种可复用的新思路(一)Visitor模式

目录何为访问者模式,从逛超市说起访问者模式的本质结构选择恰当的应用场景何为访问者模式,从逛超市说起这里使用课上的一个例子,对于超市的各个菜品,有着不同的计价规则,我们需要设计一种模式,让我们能保证在商品信息不发生大改动的情况下,可以对每个菜品采用不同的计价规则,并且这些规则可以轻易改变替换。先假设一个商品总接口public interface ItemElement { public int accept(ShoppingCartVisitor visitor);}我们假设我们对每种商品有一

2020-05-17 17:10:16 217

原创 从真实的适配器 到 java的适配器

目录适配器模式的用途基本构成例子:插头转换器总结适配器模式的用途在实际代码编写中,我们可能会在一个地方用到两种不同类型但是功能相同的类,为了能够统一调用,我们可以用一个适配器类继承一个类型的接口去委托的执行实际的另一个类型的类的功能,从而完成不同类型之间的适配功能。基本构成由UML图我们可以看到,适配器模式的大致思想:要想让两个不同类型的类相匹配,我们只需实现其中一个类的接口,在其中代理...

2020-04-28 17:30:17 151

原创 java的泛型擦除与泛型数组的可能性

目录何为泛型擦除泛型数组?另辟蹊径何为泛型擦除java中实现的泛型是伪泛型:即对于泛型graph<Integer>和graph<Double>,在编译后都会变成graph,在JVM看来没有区别。Java中的泛型基本上都是在编译器这个层次来实现的。在生成的Java字节码中是不包含泛型中的类型信息的。使用泛型的时候加上的类型参数,会在编译器在编译的时候去掉。这个过程就称为...

2020-04-22 23:18:24 140

原创 浅谈java的绑定机制--多态的基础

java绑定机制何为绑定绑定的类别静态绑定private方法static方法final方法构造方法动态绑定多态的实现何为绑定何为绑定?绑定主要是用来处理java中出现的同名方法的选择问题的。绑定是将一个方法与方法所在的类绑定起来,从而决定调用哪个方法。在java的编写中,经常无法避免的使用同名的方法,如Override或者Overload,当一个对象向上转型后,是否还能按照我们的意...

2020-04-17 22:40:37 204

原创 java中equals()与hashCode()

目录1.java中的相等2.equals的Override3.Hash容器的查找结论1.java中的相等 在讨论这两个方法的联系之前,要先搞清楚java中的两种等价,这决定我们何时使用equels方法来判断对象的等价:行为等价性观察等价性之所以会有这两种不同的等价性是针对不同的对象来讨论的:对于immutable的对象,没有提供Mutators方法,是可以放心的使用行为等价性来判...

2020-04-10 22:10:52 117

原创 java Stream File IO

Java Stream,File,IOJava.io 包几乎包含了所有操作输入、输出需要的类。所有这些流类代表了输入源和输出目标。Java.io 包中的流支持很多种格式,比如:基本类型、对象、本地化字符集等等。一个流可以理解为一个数据的序列。输入流表示从一个源读取数据,输出流表示向一个目标写数据。Java 为 I/O 提供了强大的而灵活的支持,使其更广泛地应用到文件传输和网络编程中。...

2020-02-28 10:14:18 124

原创 git基本操作入门

git相关操作整理1.在进行Git代码管理前,先要对Git进行初始化配置。使用git config设置名字和email$ git config --global user.name "your name"$ git config --global user.email "your email@email.com" 不带 --global选项设置只会在当前目录下创建.git/co...

2020-02-27 11:52:18 108

原创 csapp hit hello的一生

计算机系统大作业题 目 程序人生-Hello’s P2P 专 业 计算机科学与技术计算机科学与技术学院2019年12月摘 要文章从一个小小的hello实例出发,描写了它经历了预处理,编译,汇编,链接成一个可执行目标程序,再在shell中运行它,经历fork创建子进程,execve加载到内存,mmap映射虚拟内存开始运行,在进程管理,内存管理I/O管理的共同调...

2019-12-30 19:06:10 246

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除