创作背景
在数字化时代,社交媒体和即时通讯工具已成为人们日常生活中不可或缺的一部分。微信,作为中国最流行的即时通讯软件之一,不仅承载了人们的日常交流,更记录了无数情感的起伏与心灵的触碰。小明,一个对生活充满好奇与热情的年轻人,最近通过微信结识了一位特别的女生——小芳。他们的聊天从最初的礼貌问候,逐渐深入到彼此的兴趣爱好、生活琐事乃至心灵深处的感悟。
然而,面对这段新建立的友情,小明不禁产生了更多的好奇与期待。他渴望更加深入地了解小芳,尤其是她的性格特点——是活泼开朗,还是温婉细腻?是乐观向上,还是多愁善感?为了更科学地解读小芳的内心世界,小明决定利用自己所学的技术知识,开发一个基于微信聊天记录的分析工具。
这个工具将整合多种技术和库,包括用于文本分词的jieba、用于生成词云的wordcloud、以及用于情感分析的cnsenti。通过这些技术的结合,小明希望能够从海量的聊天记录中提炼出关键信息,如高频词汇、主题分布以及情感倾向,从而帮助自己更准确地把握小芳的性格特点和内心世界。
环境准备
pip安装以下可能需要使用的库
pip install jieba wordcloud pandas cnsenti matplotlib Pillow -i https://pypi.tuna.tsinghua.edu.cn/simple
下载Memotrace(留痕)
批量导出聊天记录的csv表格数据
csv表格字段解释
localId | TalkerId | Type | SubType | IsSender | CreateTime | Status | StrContent | StrTime | Remark | NickName | Sender |
localId:每条聊天记录在本地都有唯一的Id,用于唯一确定某一条聊天记录
TalkerId:用于唯一识别某一个发送消息的人
IsSender:为1是“我”发送,不唯一则为对方发送
CreateTime:用长