看我(PC端)主页左侧获取🎨,自取就好了。
2. 编写代码图中框出来的文本是我们不需要的(比如说图片会在这里面显示为[图片]表情显示为[表情]) 所以我们把它替换掉,我这里用到了正则:
string = open(r’C:\Users\l1768\Desktop\消息记录.txt’,‘r’,encoding=‘utf-8’).read()
s = re.compile(‘2020.+洋仔|2020.+✎﹏ℳ๓ 大大大威锅丶|表情|图片|2019.+洋仔|2019.+✎﹏ℳ๓ 大大大威锅丶|撤回了一条消息|系统消息’)#编写正则表达式
message = re.sub(s,‘’,string)#替换对应的字符串为空字符串
然后我们把经过处理的文本再进行去除特殊字符处理
def getText(text):#该函数用来替换文本中出现的特殊字符
txt = text
for ch in ‘!"#$%&()*+,-./:;<=>?@[\]^_‘{|}~,。、 :’:
txt = txt.replace(ch, “”) #将文本中特殊字符替换为空格
return txt
message = getText(message)
使用jieba分词并生成词云
split_message = jieba.lcut(message)
wordcloud_txt = ’ '.join(split_message)
w=wordcloud.WordCloud(background_color=“white”,
font_path=‘./fonts/simhei.ttf’,
width=1600,height=800,
max_words=2000)#设置生成词云的参数,background_color指定图片背景颜色,
#font_path设置中文字体,要不然中文会显示不出来
#width=1600,height=800分别指定图片的宽度像素和高度像素,
#max_words指定生成词云的词最大是两千词
#还有很多可选参数,大家可以自行百度
w.generate(wordcloud_txt)#向词云传递文本
w.to_file(“聊天记录词云.png”)#最后生成词云的图片
3.最终生成的结果:
最后
不知道你们用的什么环境,我一般都是用的Python3.6环境和pycharm解释器,没有软件,或者没有资料,没人解答问题,都可以免费领取(包括今天的代码),过几天我还会做个视频教程出来,有需要也可以领取~
给大家准备的学习资料包括但不限于:
Python 环境、pycharm编辑器/永久激活/翻译插件
python 零基础视频教程
Python 界面开发实战教程
Python 爬虫实战教程
Python 数据分析实战教程
python 游戏开发实战教程
Python 电子书100本
Python 学习路线规划
小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数初中级Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python爬虫全套学习资料》送给大家,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频
如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注:python)
目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频**
如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注:python)
[外链图片转存中…(img-PSxRJ5GU-1710978478836)]