文本分析-学习1

哈都婆

于 2023-03-06 18:42:47 发布

阅读量60

点赞数

分类专栏：文本分析文章标签： python 文本分析 Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_69379600/article/details/129367547

版权

文本分析专栏收录该内容

1 篇文章 0 订阅

订阅专栏

df2 = df.groupby("用户ID").agg({"付费金额":"sum","用户ID":"nunique"}).reset_index()

这行代码是对 DataFrame 进行分组聚合操作，按照 "用户ID" 列的值对数据进行分组，然后对每个组进行聚合计算，其中 "付费金额" 列被求和，"用户ID" 列被统计出每个组中唯一用户的数量。最后，使用 reset_index() 方法将 "用户ID" 列作为新的列添加回 DataFrame 中。这个过程的结果是生成一个新的 DataFrame 对象 df2，其中每行数据表示一个唯一的用户，列包括 "用户ID"、"付费金额"、"用户数量" 三个值。

去除停用词

这个代码与你的代码实现的功能相同。它使用列表推导式对 data_cut 列表中的每个词汇进行判断，如果这个词汇不在停用词列表 a 中，就将它添加到新的列表 new_data 中。最终得到的 new_data 列表就是去除了停用词后的结果

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

哈都婆 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。