NLP-文本和词汇-自然语言处理
第二节 词链表
中国 成都
C H E N G D U , C H I N A
目录
1链表
2索引列表
3变量
文本是什么?在一个层面上,它是一页纸上的符号序列就像这页纸一样。在另一个层面上, 它是章节的序列, 每一章由小节序列组成, 小节由段落序列组成, 以此类推。然而, 对于我们而言, 我们认为文本不外乎是词和标点符号的序列。
【例2 - 1 】下面是我们如何在 Python 中表示文本, 如何表示《白鲸记》的开篇句, 查询它的长度? 每个文本开始的句子定义为 sent1…sent9。请检查其中的两个句子?
sent1 = [‘Call’, ‘me’, ‘Ishmael’, ‘.’]
这个方括号内的东西在 Python 中叫做链表(list,也叫列表): 它就是我们存储文本的方式。我们可以通过输入它的名字来查阅它。
检查