python extractall函数_Pandas从str.extractall('#')中给出错误

我正试图过滤tweet文本中的所有#关键字。我使用str.extractall()来提取所有带有#关键字的关键字。

这是我第一次使用pandas从tweetText中过滤关键字。输入、代码、预期输出和错误如下所示。

输入:userID,tweetText

01, home #sweet home

01, #happy #life

02, #world peace

03, #all are one

04, world tour

等等。。。总的数据文件是用GB大小的scraped tweets和其他几列组成的。但我只对两个专栏感兴趣。

代码:import re

import pandas as pd

data = pd.read_csv('Text.csv', index_col=0, header=None, names=['userID', 'tweetText'])

fout = data['tweetText'].str.extractall('#')

print fout

预期产量:userID,tweetText

01,#sweet

01,#happy

01,#life

02,#world

03,#all

错误:Traceback (most recent call last):

File "keyword_split.py", line 7, in

fout = data['tweetText'].str.extractall('#')

File &#

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
import pandas as pd import datetime import tkinter as tk # 获取当前日期,格式为年月日 now = datetime.datetime.now().strftime('%Y%m%d') # 读取Excel文件 data = pd.read_excel(r'E:\每日数据\智能POS明细.xlsx',dtype={'商户编号':str,'终端编号':str}) # 获取省份列表 department_list = data['省份'].unique() # 事件处理程序,按省份提取数据 def extract_by_department(): # 用户输入省份名称 department_name = department_entry.get() # 按照省份拆分数据 if department_name in department_list: new_df = data[data['省份'] == department_name ] file_name = department_name + '智能POS明细' + now + '.xlsx' new_df.to_excel(file_name, index=False) result_label.config(text="数据提取成功!") else: result_label.config(text="闲的没事干了,就去给靓坤一大逼斗,请重新选择!!!") # 事件处理程序,全部提取数据 def extract_all(): # 循环按照省份拆分数据 for department in department_list: new_df = data[data['省份'] == department] file_name = department + '智能POS明细' + now + '.xlsx' new_df.to_excel(file_name, index=False) result_label.config(text="数据提取成功!") # 创建窗口 window = tk.Tk() window.title("智能POS明细数据提取") window.geometry("400x200") # 创建控件 department_label = tk.Label(window, text="省份名称:") department_entry = tk.Entry(window) extract_by_department_button = tk.Button(window, text="按省提取", command=extract_by_department) extract_all_button = tk.Button(window, text="全部提取", command=extract_all) result_label = tk.Label(window, text="") # 显示控件 department_label.pack() department_entry.pack() extract_by_department_button.pack() extract_all_button.pack() result_label.pack() # 运行窗口 window.mainloop()
06-12

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值