统计自然语言处理自学笔记(1)

基本概念

树和图

树和图的概念与数据结构里基本相同

字符串

假设\small \sum是字符的有限集合(里面的元素都是不同的字符),一般称之为字符表

\small \sum中字符以任意顺序,任意重复次数相连而成的有限序列叫做\small \sum上的字符串

例如\small \sum=\{a,b,c,d\},共四个字符组成的集合,则aaa,abc,abbbc,abcd均是\small \sum上的字符串。

特别的,如果这个字符串里不包含任意一个字符,则称之为空字符串,记为\small \epsilon

包括空串在内的所有由字符集\small \sum组成的字符串记为\small \sum{}^*,称之为\small \sum上的闭包。如果不含空串,则叫做正闭包,记作\small \sum{}^+

两个字符串的连接:字符串\small s_1与字符串\small s_2连接后的字符串则为\small s_1s_2

字符串的幂:字符串\small s的0次幂\small s^0=\epsilon。1次幂\small s^1=s,2次幂\small s^2=ss。即幂为几次就是几个s连接。

字符集的乘积:设两个字符串集合\small A\small B,那么他们的乘积也是一个字符串集合,该字符串集合包含任意从\small A,B内分别抽取字符串连接而成的新字符串,即\small AB=\{xy| x \in A,y \in B\}。同样,\small A和自己也可以相乘,变成\small A的幂,定义\small A^0=\{\epsilon\}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值