《自然语言处理——冯志伟》学习记录(一)

A. M.  Turning算法计算模型的研究

N. Chomsky形式语言理论的研究

C. E. Shannon概率和信息论模型的研究

结构化数据、非结构化数据

正则表达式

有限自动机:一般我们会用状态图来描述一个有限自动机。它有且只有一个起始状态,有一些接收状态。有限自动机的输出是接收或者拒绝。有限自动机的形式定义。有限自动机是一个五元组。

Markov链:

随机过程有两层含义:

1.它是一个时间上的函数,随着时间的改变而改变。

2.每个时刻的函数值是不同的,是随机的,也就是说,每一时刻上的函数值按照一定的概率分布。

语言的使用被当作一个随机过程,在这个随机过程中,所出现的语言符号是随机试验的结局,语言就是一系列具有不同随机试验结局的链

原始的Markov过程:在已知的当前状态的情况下,过程的未来状态与它过去的状态无关

Markov链:每个语言符号的出现概率不相互独立,每一个随机试验的个别结局依赖于它前面的随机试验的结局。**Markov**链的重数不是无穷增加的,它的极限是语法上和语义上成立的自然语言句子的集合。

单参数频率分布规律

双参数频率分布规律

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值