Python-QQ聊天记录分析-jieba+wordcloud

QQ聊天记录简单分析

0. Description

  从QQ导出了和好友从2016-08-25到2017-11-18的消息记录,85874行,也算不少。于是就有了大致分析、可视化一下。步骤大致如下:

  • 消息记录文件预处理
  • 使用jieba分词
  • 使用wordcloud生成词云
  • 生成简单图表

  结果大致如下:

1. Preprocessing

  导出的文件大概格式如下:(已去掉多余空行)

2016-08-26 11:02:56 PM 少平
这……
2016-08-26 11:03:02 PM 少平
这bug都被你发现了
2016-08-26 11:03:04 PM C
反驳呀
2016-08-26 11:03:25 PM C
too young
2016-08-26 11:04:43 PM C
我去刷鞋子
2016-08-26 11:04:58 PM 少平
嗯嗯
好的

Observation&Notice:

  • 每条消息上都有对应发送时间和发送者
  • 列表内容
  • 一条消息内可能有换行

  由此,

  • 可以依照发送者对消息分开为聊天双方。
  • 将各自的内容分别放在文件中,便于后续分词和制作词云。
  • 将所有聊天时间抽取出来,可以对聊天时段进行分析和图表绘制。

Arguments:
   infile 原始导出消息记录文件
   ou

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值