python txt转dataframe_如何将这个.txt转换成一个dataframe?

我正在尝试在Python中进行Whatsapp分析,我想将其转换为包含日期,小时,人物和消息列的数据框。'[8/23/17, 1:45:10 AM] Guillermina: Guten Morgen',

'[8/23/17, 1:47:05 AM] Kester Stieldorf: Good morning :) was in Düsseldorf one hour ago ;)',

'[8/23/17, 1:47:16 AM] Guillermina: Hahahaha',

'[8/23/17, 1:47:19 AM] Guillermina: What?',

'[8/23/17, 1:47:36 AM] Kester Stieldorf: Yeah had to pick something up',

我已经尝试过:pieces = [x.strip('\n') for x in file_read.split('\n')]

beg_pattern = r'\d+/\d+/\d+,\s+\d+:\d+\s+\w+\.\w+\.'

pattern = r'\d+/(\d+/\d+),\s+\d+:\d+\s+\w+\.\w+\.\s+-\s+(\w+|\w+\s+\w+|\w+\s+\w+\s+\w+|\w+\s+\w+\.\s+\w+|\w+\s+\w+-\w+|\w+\'\w+\s+\w+|\+\d+\s+\(\W+\d+\)\s+\d+-\d+\W+|\W+\+\d+\s+\d+\s+\d+\s+\d+\W+|\W+\+\d+\s+\d+\w+\W+):(.*)'

reg = re.compile(beg_pattern)

regex = re.compile(pattern)

remove_blanks = [x for x in pieces if reg.match(x)]

blanks = [x for x in pieces if not reg.match(x)]

grouped_data = []

for x in remove_blanks:

grouped_data.extend(regex.findall(x))

grouped_data_list = [list(x) for x in grouped_data]

但不管用。我很确定re.install()存在问题,因为当我输出reg和regex时,它们返回空数组。我怎么解决这个问题?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值