针对实践(一)代码的修改

代码修改

实践(一)代码总的运行时间为3800seconds左右,实在是烂到不行,不忍直视。这几天正好开始进行《利用python进行数据分析》这本书的学习,于是尝试着对实践(一)的代码的数据导入与数据重建部分的代码进行了修改,效果拔群,运行时间由惨不忍睹的3800seconds降到11seconds左右,特此记录。

# 数据导入
path = 'feiche.json'
aa = open(path).readlines()
records = [json.loads(line) for line in aa if is_json(line)]

frame = pd.DataFrame(records)
# 提取数据中的‘header’和‘event’,组成新的数据框
frame_temp = frame[['header','event']]
# 清理数据并重置index
clean_event = frame_temp.dropna(how='any').reset_index(drop='True')

# 数据重建
new_data = []
for i in range(len(clean_event)):
    m2 = clean_event['header'][i]['m2']
    event = clean_event['event'][i]
    new_data.append([dict(temp,Session=k, m2=m2) for k,v in event.items() for temp in v])
# 数据平铺
data = [item for record in new_data for item in record]
# 数据重建和缺失值填充
df = pd.DataFrame(data).fillna('')

以前的代码就不贴过来对比了,反正就是代码简洁清晰了很多,花费时间大大降低。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值