# -*- coding: utf-8 -*-
from __future__ import unicode_literals
import nltk.tokenize as tk
#需要分词的文本
doc = "Are you ok? \
I'm fun,and you? \
I'm ok."
#文本分句
tokens = tk.sent_tokenize(doc
Python自然语言处理——nltk库入门之文本分词(英文)
最新推荐文章于 2023-10-12 10:06:21 发布