python12315消费者投诉举报咨询信息文本挖掘_python 文本挖掘

最新推荐文章于 2022-11-03 02:31:39 发布

weixin_39932458

最新推荐文章于 2022-11-03 02:31:39 发布

阅读量483

点赞数

文章标签： python12315消费者投诉举报咨询信息文本挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39932458/article/details/111849094

版权

分词def getSeg(text,wd_dict):#定义分词的判断条件if not text:return “”if len(text)==1:return textif text in wd_dict:return textelse:new_length=len(text)-1text=text[0:new_length]res=getSeg(text,wd_dict)return resd...

摘要由CSDN通过智能技术生成

分词

def getSeg(text,wd_dict):#定义分词的判断条件

if not text:

return “”

if len(text)==1:

return text

if text in wd_dict:

return text

else:

new_length=len(text)-1

text=text[0:new_length]

res=getSeg(text,wd_dict)

return res

def main (text_str,n_len,dict_name): #定义最大正向匹配

text_str=text_str.strip()#去除字符串前后空格

max_len=n_len#定义最大匹配分词长度

result_str=''#保存要输出的结果

while text_str:

new_text=text_str[0:max_len]

seg_str=getSeg(new_text,dict_name)

result_str=result_str+seg_str+'/'

seg_len=len(seg_str)

text_str=text_str[seg_len:]

return result_str

print('分词结束')

jieba分词：安装pip install jieba

支持三种分词模式：

精确模式：试图将句子最精确的分开，适合文本分析

全

最低0.47元/天解锁文章

weixin_39932458

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python12315消费者投诉举报咨询信息文本挖掘_python 文本挖掘

分词def getSeg(text,wd_dict):#定义分词的判断条件if not text:return “”if len(text)==1:return textif text in wd_dict:return textelse:new_length=len(text)-1text=text[0:new_length]res=getSeg(text,wd_dict)return resd...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。