python基础练习题

python库,果然简单。识别中文分词,如果用C或者JAVA,需要写多少行?

import jieba
s = "中国特色社会主义进入新时代,我国社会主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。"
n = len(s)
wordlist=jieba.lcut(s)
m = len(wordlist)
print("中文字符数为{},中文词语数为{}。".format(n, m))
print(wordlist)

>>> 
================== RESTART: D:\19python\二级python\textdd.py ==================
Building prefix dict from the default dictionary ...
Loading model from cache C:\Users\ADMINI~1\AppData\Local\Temp\jieba.cache
Loading model cost 1.378 seconds.
Prefix dict has been built succesfully.
中文字符数为56,中文词语数为29。
['中国', '特色', '社会主义', '进入', '新', '时代', ',', '我国', '社会', '主要矛盾', '已经', '转化', '为', '人民', '日益增长', '的', '美好生活', '需要', '和', '不', '平衡', '不', '充分', '的', '发展', '之间', '的', '矛盾', '。']
>>> 

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值