看起来您的代码中有一个错误。错误消息指示您正在向 play _ parse 函数传递 Series 对象,而不是字符串。这可能是因为您试图在熊猫 DataFrame 上迭代,并将 DataFrame 的一列传递给函数。
要修复此错误,您应该确保将一个字符串传递给 play _ parse 函数。一种方法是使用 application 方法将函数应用于 DataFrame 的每一行。
下面是一个如何修改代码以使用 application 方法的示例:
这段代码使用apply方法将play_parse函数应用到Play列的每一行。
import pandas as pd
import re
def play_parse(s):
#观看view #点赞like #评论comment
match = re.search(r' · (.*)观看 · (.*)点赞 · (.*)条评论 ', s)
if match:
view, like, comment = match.groups()

本文探讨了在处理B站评论数据分析时,如何利用Python的正则表达式提取关键信息。通过play_parse函数,使用re.search匹配字符串中的观看次数、点赞次数和评论次数,再结合/groups()方法获取匹配数据。同时,介绍了如何在Pandas DataFrame中应用函数,如使用.apply(pd.Series)方法处理数据列。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



