IKAnalyzer的分词效果

       为了能够对抓取的中文信息进行检,需要选择分词器对其进行分词,IKAnalyzer是一个不错的选择,小试了一下IKAnalyzer的分词效果,感觉不错,代码如下:

 

分词之后的结果如下:

苏轼|不是|圣人|他|最可|可贵|的|地方|是|在|痛苦|彷徨|挣扎|中|总能|能把|自己|的|心灵|置于|更广|广阔|的|天地|地中|如同|赤壁|后|赋|中|横飞|而去|的|老|鹤|戛戛|于|星空|夜|月|长河|大江|之上|澄明|明清|清澈|皎|然|不|滓|苏轼|是|一个|一|个|善于|于|苦|中|找乐|的人|这种|乐观|与|真|趣|帮|他|度过|过了|不少|难关|画家|陈|丹青|说|鲁迅|是|一个|一|个|有趣|的人|我|想|拿来|来说|苏东坡|东坡|一样|一|样|也行|

 

接下来准备了解一下统计一个文本中关键词出现次数的方法,然后简单的利用出现次数对一些文本进行排序。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值