自然语言处理中的模式(模式0:模式无处不在模式)

原创 2018年04月16日 11:52:41
/*版权声明:可以任意转载,转载时请务必标明文章原始出处和作者信息 .*/

自然语言处理中的模式(模式0:模式无处不在模式)

CopyMiddle:张俊林

TimeStamp:20107

对于模式这个概念,身为IT技术人员应该对此不陌生了。四人帮的巨著《设计模式》已然成为经典。那么,模式仅仅局限于软件设计领域吗?显然非也,最初四人帮归纳设计模式的诱发因素也是建筑设计领域的模式。对于自然语言处理领域,同样是存在模式的,这里的模式主要是针对相关专业研究人员的,可以认为是帮助研究人员从宏观上理解某个领域的研究模式。当然,我相信任何其他研究领域也存在类似的研究模式。所以,这也可以认为是一个模式,即模式0:模式无处不在模式。

所谓模式无处不在,即任何领域都存在模式,比如历史事件中的模式,如果你读过一些历史的话,会发现很多人在很多场合做的很多决策以及其决策的结果有非常相似的重合之处,这里显然就是模式的影子了,举个大点的例子,有没有觉得抗日战争时期和三国时期有非常相似之处?中共,国民党和鬼子之间的关系以及决策和魏、蜀、吴是否能够找到对应关系?其实,再抽象一步,你可以从中归纳出三个政治实体博弈的一个基本模式出来,这是历史上的模式。相似的,比如在政治模型,经济方法,技术手段等等各种五光十色五花八门的领域中,这种模式的痕迹几乎无处不在,几无例外。此谓模式无处不在。

深入思考一下,模式到底是什么东西呢?所谓模式实际是某个领域内过去经验地系统总结。不论是哪个领域,只要这个领域已经存在,那么就存在经验,经验有成功的有失败的,存在经验就有对经验地评价,将对经验的评价进行分析总结就是模式。所以,模式无处不在,因为经验无处不在,模式本质上是一种经验主义思考方法,是一种归纳法。模式有助于快速掌握别人流传下的经验,让新人快速上手解决复杂问题,但是,仅仅依靠模式是难以创造新的东西的,如果能够结合演绎法,就可以指导实际,创造出新的东西。也就是说:经验总结-->归纳法-->模式-->演绎法-->将已经证明的模式应用在没有用过的领域--->新的产出--->形成新的经验 依此反复,这个才是模式真正威力所在。

回到自然语言处理研究中的模式上来,自然语言处理相关的国际会议有ACL,COLING,EMENP等等,如果你经常跟踪会议论文并整理子领域的研究进展脉络的话,会发现在这个领域的研究中一样存在着固定的研究模式,其子领域的发展是有路径可循甚至是可以预测其发展方向的。举个比较明显的子领域,比如统计机器翻译,从最初的单词对的翻译加上顺序调整,到扩展为短语对的翻译加上顺序调整,再到目前比较热的字符串到树结构的映射,树结构之间的映射等,其发展脉络非常清楚,这种走向其实也是研究模式的一种具体表现,如果是有经验的研究人员是很容易看出其整体发展趋势的,那么对于自己的选择课题是非常有帮助作用的。

过去我接触过很多博士生,对于如何创新好像始终摸不住脉,看了一大堆论文,但是自己的想法无从谈起,其实这是对研究模式理解不够深入导致的,我相信如果熟悉一些NLP研究领域中比较常见的研究模式,对于做一些理论探索和创新是非常有帮助的。

在后续的文章里,我会逐步把我在2006年之前归纳出的若干常见的NLP研究领域的研究模式一一列出,分享观点,抛砖引玉,也希望能对谁有所帮助。

 

自然语言处理中的模式(模式1.概率化模式)

在自然语言处理中,歧义是非常容易出现的问题,无论是在分词,句法,语义各个层面都会面临歧义的问题,所谓歧义代表了对于一个输入有若干种输出,那么此时选择哪个作为正确输出就成为了一个问题。概率的引入为此提供...
  • malefactor
  • malefactor
  • 2010-08-12 15:33:00
  • 11888

50种思维方式

上帝思维:要想得到别人的帮助,你要先帮助别人。   司马光思维:打破旧有的框架,寻找新的资源、新的规则、新的原理、新的目标、新的发现。   孙子思维:知己知彼才能百战百胜。适用于竞争中,想控制...
  • u013360656
  • u013360656
  • 2015-07-23 18:54:25
  • 616

SPI四种模式区别

SPI四种模式区别   spi四种模式SPI的相位(CPHA)和极性(CPOL)分别可以为0或1,对应的4种组合构成了SPI的4种模式(mode) Mode 0 CPOL=0, CPHA=0  Mo...
  • yihui8
  • yihui8
  • 2017-01-10 19:36:44
  • 16584

mp288 解决进入不了维修模式 不显示0

  • 2012年12月12日 10:51
  • 259KB
  • 下载

数据库中模式的意义

概念 模式,也称为逻辑模式,是数据库中全体数据的逻辑特征和特征描述,是所有用户的公用数据视图。一个数据库只有一个模式,而外模式不是唯一也不可能是唯一的,模式是数据库逻辑上的视图。数据库模式以某一种数...
  • woshismyawei
  • woshismyawei
  • 2014-02-19 08:48:32
  • 1034

超低功耗msp430的几种工作模式及看门狗原理

  • 2012年02月16日 21:00
  • 283KB
  • 下载

什么是SVC模式

ARM 处理器有二十七个寄存器,其中一些是在一定条件下使用的,所以一次只能使用十六个... 寄存器 0 到寄存器 7 是通用寄存器并可以用做任何目的。不象 80x86 处理器那样要求特定寄存器...
  • jobsss
  • jobsss
  • 2012-05-09 09:22:35
  • 10267

设置系统工作在SVC模式---嵌入式回归第七篇

ARM处理器有七种工作模式,对于uboot模式而已,系统工作在SVC模式,可以操作更多的资源。 通过设置程序状态寄存器CPSR15(这个可以根据手册查到): 可以看到这5位要设置成10011,即把GP...
  • coding__madman
  • coding__madman
  • 2016-04-24 01:13:51
  • 893

android 4.2 系统以后的飞行模式

项目中遇到了要控制飞行模式的功能,钻研了几天,终于解决。 解决过程中最大的问题是: android 4.2 之后 系统不予许第三方软件去设置飞行模式,除非你的app是系统应用,得到了root权限。 ...
  • hrklzwzj
  • hrklzwzj
  • 2016-07-18 11:45:32
  • 2835
收藏助手
不良信息举报
您举报文章:自然语言处理中的模式(模式0:模式无处不在模式)
举报原因:
原因补充:

(最多只允许输入30个字)