python很多行文本同时进行结巴分词

原数据:文本,一行为一个评论
处理的目的:目标数据:每条评论去掉停词,留下关键词。不同评论依然按行分开
原数据的评论text:

开机有点烦锁,联网时有些软件会自动下载安装!!	
今天拿的货 电脑很好完美屏 开始还担心屏幕有坏点 屏幕没问题 好评	
感觉应该是正品,键盘的触感很好,屏幕画质清晰,看电视很舒服!散热很好,没有机子发热的情况!
obj = []
with open(txt, 'r', encoding='utf8') as f:
	i = 0
	for line in f:
		for w in jieba.cut(line.strip()):
			obj.append([])
			if w not in stopwords and w != ' ':
				obj.append(w)
		i += 1

经过处理,可以变成一个矩阵,不同行的评论依旧在不同的行。而不是一个一维的向量,全部都连在一起。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值