python清洗数据去除停用词_Python从pandas数据帧中删除停用词

我想从我的专栏“tweets”中删除停用词.如何迭代每一行和每个项目?

pos_tweets = [('I love this car', 'positive'),

('This view is amazing', 'positive'),

('I feel great this morning', 'positive'),

('I am so excited about the concert', 'positive'),

('He is my best friend', 'positive')]

test = pd.DataFrame(pos_tweets)

test.columns = ["tweet","class"]

test["tweet"] = test["tweet"].str.lower().str.split()

from nltk.corpus import stopwords

stop = stopwords.words('english')

解决方法:

使用列表理解

test['tweet'].apply(lambda x: [item for item in x if item not in stop])

返回:

0 [love, car]

1 [view, amazing]

2 [feel, great, morning]

3 [excited, concert]

4 [best, friend]

标签:python,pandas

来源: https://codeday.me/bug/20190926/1821562.html

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值