Python学习笔记--获取好友信息

参考链接:https://zhuanlan.zhihu.com/p/36418880
一、代码实现:

# -*- coding:utf-8 -*-
# 微信撤回消息
# python2
# 参考链接:https://zhuanlan.zhihu.com/p/36418880

import itchat
itchat.login()

# 爬取自己好友相关信息,返回一个json文件
friends = itchat.get_friends(update=True)[0:]
#print friends

# 1、获得微信好友性别比例
male = female = other = 0
for i in friends[1:]: # friengs[0]是自己的信息
    sex = i['Sex']
    if sex == 1:
        male += 1
    elif sex == 2:
        female += 1
    else:
        other += 1

total = len(friends[1:])
print "男性好友: %.2f%%" % (float(male)/total*100) + '\n' + "女性好友: %.2f%%" % (float(female)/total*100) + '\n' +\
    "不明性别好友: %.2f%%" % (float(other)/total*100)

# 2、获得微信好友城市分布
# 首先定义一个函数爬去各个变量

def get_var(var):
    variable = []
    for i in friends:
        value = i[var]
        if type(value) != int:
            value = value.encode('utf-8')
        variable.append(value)
    return variable
Nickname = get_var('NickName')
#print Nickname
Sex = get_var('Sex')
Province = get_var('Province')
City = get_var('City')
RemarkName = get_var('RemarkName') # 备注名
Signature = get_var('Signature')

from pandas import DataFrame
data = {"NickName":Nickname,"Sex":Sex,"Province":Province,"City":City,"Signature":Signature,"RemarkName":RemarkName}
frame = DataFrame(data)
frame.to_csv('data.csv')

# 3、微信好友签名自定义云图
# 首先将签名表示出来,并去除各种表情什么的,再用正则表达式去除《>=等符号
import re
siglist = []
for i in friends:
    signature = i['Signature'].encode('utf-8').strip().replace('span','').replace('class','').replace('emoji',"")
    print signature
    #siglist.append(signature)
    rep = re.compile("1f\d+\w*|[<>/=]") # 正则表达式???没懂。。。
    signature = rep.sub('',signature)
    siglist.append(signature)
    print siglist
text = "".join(siglist)
print text.replace(" ","").replace("\n","")

# 结巴分词包,对字符串进行分词
# 它是Python最好的中文分词组件;
import jieba
wordlist = jieba.cut(text,cut_all=True) # 全模式;False为精确模式;无为默认模式;cut_search_for()为搜索引擎模式
word_space_split = " ".join(wordlist)
print word_space_split

# 画图
import matplotlib.pyplot as plt
from wordcloud import WordCloud,ImageColorGenerator
import numpy as np
import PIL.Image as Image


coloring = np.array(Image.open(r"C:\Users\ZHYU\PycharmProjects\wechat\1.png"))
my_wordcloud = WordCloud(background_color='white',max_words=2000,mask=coloring,max_font_size=60,random_state=42,\
                         scale=2,font_path=r"C:\Users\ZHYU\Downloads\NotoSans-hinted\NotoSans-Black.ttf").generate(word_space_split)
image_colors = ImageColorGenerator(coloring)
plt.imshow(my_wordcloud.recolor(color_func=image_colors))
plt.imshow(my_wordcloud)
plt.axis("off")
plt.show()

itchat.logout()

运行结果:
这里写图片描述

二、遇到的问题
1、编码问题:由于用search_friends()得到的是所有好友信息的json数据,所以得到的昵称、签名等都是u’\u789’这种unicode形式,需要将其转为汉字表示时,用encode(“utf-8”)即可。

2、安装PIL遇到的问题,直接用pip安装后,运行报错:

ImportError: The _imagingft C module is not installed

经过百度找到了解决方案,在此链接上下载与你的系统对应的pillow版本
https://www.lfd.uci.edu/~gohlke/pythonlibs/#pillow即可成功运行!

3、最后的云图出现了乱码……此问题还未解决……下午再看

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python学习笔记》是由皮大庆编写的一本关于Python语言学习的教材。在这本书中,作者详细介绍了Python语言的基础知识、语法规则以及常用的编程技巧。 首先,作者简要介绍了Python语言的特点和优势。他提到,Python是一种易于学习和使用的编程语言,受到了广大程序员的喜爱。Python具有简洁、清晰的语法结构,使得代码可读性极高,同时也提供了丰富的库和模块,能够快速实现各种功能。 接着,作者详细讲解了Python的基本语法。他从变量、数据类型、运算符等基础知识开始,逐步介绍了条件语句、循环控制、函数、模块等高级概念。同时,作者通过大量的示例代码和实践案例,帮助读者加深对Python编程的理解和应用。 在书中,作者还特别强调了编写规范和良好的编程习惯。他从命名规范、注释风格、代码缩进等方面指导读者如何写出清晰、可读性强的Python代码。作者认为,良好的编程习惯对于提高代码质量和提高工作效率非常重要。 此外,作者还介绍了Python的常用库和模块。他提到了一些常用的库,如Numpy、Pandas、Matplotlib等。这些库在数据处理、科学计算、可视化等领域有广泛的应用,帮助读者更好地解决实际问题。 总的来说,《Python学习笔记》是一本非常实用和全面的Python学习教材。通过学习这本书,读者可以系统地学习和掌握Python编程的基础知识和高级应用技巧,为以后的编程学习和工作打下坚实的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值