python将结果写入txt文件_python 将分词结果写入txt文件

首先我运用的分词工具是结巴分词 import jieba 然后调用jieba.cut( ) 但是jieba.cut 返回的是一个generator的迭代器

他可以显示分词结果 但是无法将结果写入txt 各种报错。类似于a bytes-like object is required, not 'generator'

然后我将结果进行了Str( )处理 还是报类似的错误 只不过变成了not ' generator'

然后经过思考我将结果作list( )处理 然后对生成的list进行处理,去' [ ' ,' ] '和' ,'

def text_save(filename,data):

file= open(filename,'a+')for i inrange(len(data)):

s= str(data[i]).replace('[','').replace(']','')

s= s.replace("'",'').replace(',','')+' 'l=clearSen(s)

file.write(l)

# file.close(s)

然后可以写进去了 但是遇到乱码问题,写入txt中的文本乱码mmp。

1393369-20190507165517522-449429950.png

在终端测试各个步骤的输出结果,发现是在对list( )处理时,应该加入utf-8操作。

1393369-20190507170028688-58628105.png

1393369-20190507170055652-166523739.png

def text_save(filename,data):

file= open(filename,'a+',encoding='utf-8')for i inrange(len(data)):

s= str(data[i]).replace('[','').replace(']','')

s= s.replace("'",'').replace(',','')+' 'l=clearSen(s)

file.write(l)

# file.close(s)

#添加句子功能

def usr_add_sentence():

correct_sentence= entry_add.get()

correct_sentences=list(jieba.cut(correct_sentence))

# clearSen(correct_sentences)

print(correct_sentences)

text_save('./data/kenlm/2014_words.txt',correct_sentences)

text_save('./data/kenlm/people2014_words.txt',correct_sentences)

over~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值