python 导入excel 分词_语料工具--Python--jieba分词和Excel文件处理

#encoding=utf-8

import jieba

import xlrd

from datetime import date,datetime

import xdrlib,sys

import xlwt

def read_excel():

data =xlrd.open_workbook(r'C:\Users\weifu\Desktop\S0999\source_files.xls')

file = xlwt.Workbook()

table_w = file.add_sheet('fc',cell_overwrite_ok=True)

table = data.sheet_by_index(0)

nrows = table.nrows

ncols = table.ncols

for i in range(nrows):

seg_list = jieba.cut(str(table.row(i)[1].value))

print (table.row(i)[1].value)

value = " / ".join(seg_list)

if i > 0 :

table_w.write(i,0,table.row_values(i)[0])

table_w.write(i,1,table.row_values(i)[1])

table_w.write(i,2,value)

else :

table_w.write(0,0,"文件名")

table_w.write(0,1,"原词")

table_w.write(0,2,"分词结果")

file.save(r'C:\Users\weifu\Desktop\S0999\source_files_fc.xls')

read_excel()

  • 0
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值