【NLP】自然语言处理-第二节 词链表

NLP-文本和词汇-自然语言处理

第二节 词链表

中国 成都
C H E N G D U , C H I N A

目录
1链表
2索引列表
3变量

文本是什么?在一个层面上,它是一页纸上的符号序列就像这页纸一样。在另一个层面上, 它是章节的序列, 每一章由小节序列组成, 小节由段落序列组成, 以此类推。然而, 对于我们而言, 我们认为文本不外乎是词和标点符号的序列。

【例2 - 1 】下面是我们如何在 Python 中表示文本, 如何表示《白鲸记》的开篇句, 查询它的长度? 每个文本开始的句子定义为 sent1…sent9。请检查其中的两个句子?

sent1 = [‘Call’, ‘me’, ‘Ishmael’, ‘.’]

这个方括号内的东西在 Python 中叫做链表(list,也叫列表): 它就是我们存储文本的方式。我们可以通过输入它的名字来查阅它。
在这里插入图片描述

检查句子

sent4 + sent5
在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值