一、基础小结
三种分词模式:
import jieba
seg_str = "世界上一成不变的东西,只有“任何事物都是在不断变化的”这条真理。"
print("/".join(jieba.lcut(seg_str))) # 精简模式,返回一个列表类型的结果
print("/".join(jieba.lcut(seg_str, cut_all=True))) # 全模式,使用 'cut_all=True' 指定
print("/".join(jieba.lcut_for_search(seg_str))) # 搜索引擎模式
#输出
世界/上/一成不变/的/东西/,/只有/“/任何事物/都/是/在/不断/变化/的/”/这/条/真理/。
世界/上/一成/一成不变/不变/的/东西///只有///任何/任何事物/何事/事物/都/是/在/不断/变化/的///这条/真理//
世界/上/一成/不变/一成不变/的/东西/,/只有/“/任何/何事/事物/任何事物/都/是/在/不断/变化/的/”/这/条/真理/。
二、牛刀小试
1、从键盘输入一个中文字符串变量 s,内部包含中文逗号和句号。
问题1:计算字符串 s 中的中文字符个数,不包括中文逗号和句号字符。示例如下: