初识jieba(py3)

data=open('/Users/momo/Desktop/小论文/模拟/红楼梦/红楼梦.txt')  

#for line in data:
   # print(line)
type(data)
fout = open('/Users/momo/Desktop/小论文/模拟/红楼梦/output.txt', 'w')
import jieba as jb
seg_list = jb.cut('你是谁', cut_all=True)
print("Full Mode:", "/ ".join(seg_list))  # 全模式
Full Mode: 你/ 是/ 谁
for eachLine in data: 
    wordList = list(jb.cut(eachLine))#用结巴分词,对每行内容进行分词
    outStr = '' 
    for word in wordList:  
            outStr += word  
            outStr += '/ '
    fout.write(outStr.strip()+'\n') #将分词好的结果写入到输出文件
data.close()  
fout.close() 

待学习:分词流程处理,分词字典应用

阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/paulsweet123/article/details/52357501
个人分类: jieba python3
上一篇dict(待补充)
下一篇玩JoinQuant的开始
想对作者说点什么? 我来说一句

Jieba分词工具的使用

2018年01月16日 835KB 下载

jieba分词词典和停用词

2018年03月28日 2.9MB 下载

NLP自然语言处理jieba源码0.39

2018年04月25日 11.53MB 下载

没有更多推荐了,返回首页

关闭
关闭