python之jieba

中文分词

调用jieba的cut对中文字符串进行分词即可,返回一个生成器

In [1]: import jieba

In [2]: strings='直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或
   ...: 频率,宽度则表示各组的组距,其高度与宽度均有意义'

In [3]: data=jieba.cut(strings)

In [4]: type(data)
Out[4]: generator

In [5]: list(data)
Building prefix dict from the default dictionary ...
Loading model from cache /tmp/jieba.cache
Loading model cost 1.077 seconds.
Prefix dict has been built succesfully.
Out[5]: 
['直方图',
 '是',
 '用',
 '面积',
 '表示',
 '各组',
 '频数',
 '的',
 '多少',
 ',',
 '矩形',
 '的',
 '高度',
 '表示',
 '每',
 '一组',
 '的',
 '频数',
 '或',
 '频率',
 ',',
 '宽度',
 '则',
 '表示',
 '各组',
 '的',
 '组距',
 ',',
 '其',
 '高度',
 '与',
 '宽度',
 '均',
 '有',
 '意义']

In [6]: 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值