写在前面: 首次写csdn的博客, 记录一次涉及爬虫, 中文词句情感分析, 数据可视化的社会计算作业, 不过仅涉及非常粗浅的介绍和本次作业中用到的内容, 会在每个板块最后附上相应内容学习的其他博客链接.
分析题意
对于2019年度的电影评分数据,电影描述以及标签信息等数据进行获取和分析,作一份电影分析报告。
要求内容:
1. 正面,负面,中性评价比率
2. 粉丝分布属性
3. 票房属性
完成作业大概分为三个板块:
- 获取豆瓣上的电影数据
1.爬虫的基础知识
2.BeautifulSoup库的使用 - 分析数据(情感分析)
1.python对excel的操作
2.中文情感分析snowNLP库的使用 - 可视化表示数据
1.excel的图表操作
2.python的matplotlib库画三维散点图
本篇博客只涉及到第三板块的内容,其他内容在专栏中
了解敌情
我们首先观察一下作业样例中用到的可视化后的数据
1.直方图
2.奇怪的散点图
3.柱状图
4.百分比堆积柱状图
5.三维散点图
6.饼图
除了第五个三维散点图不能用excel以外,其他的都可以用excel自带的图表工具完成,1和3比较简单,就不赘述了,
excel可以做的
奇怪的散点图
刚看到看到这个图不知道是啥玩意 , 打开excel以后发现其实就是散点图excel的散点图
话不多说 , 直接看图就行
看完就知道除了第五个以外的图了
excel做不了的,咱用python做
这里要使用一个常用的可视化库 matplotlib
- 库的引用
import matplotlib.pyplot as plt
import matplotlib
- 操作
fig = plt.figure() #创建画布
ax1 = plt.axes(projection = '3d') #创建三维的坐标系
xd = [1,2,3,4,5]
yd = [1,2,3,4,5]
zd = [1,2,3,4,5] #xd,yd,zd分别为x , y , z三个轴的坐标
#此处包含了(1,1),(2,2),(3,3),(4,4),(5,5)共5个点
plt.xlabel('positive prob')
plt.ylabel('negative prob') # 给坐标轴附上名字
ax1.scatter3D(xd,yd,zd,color = 'red') # 把xd,yd,zd放入绘制散点图
plt.show()#展示出绘制出来的散点图
但是好像似乎并没有找到让z轴有名字的方法
所以我们要做的事情就是用上一篇中的python对execl的操作将各个坐标放入xd,yd,zd中,然后按照刚才的代码进行可视化即可
注意 : 此处的x,y,z轴的标度等并不需要我们自己设置,会根据xd,yd,zd自动生成.
您还可以点击matplotlib入门来获取更多matplotlib的入门操作
基础知识应该就这些了,欢迎补充其他的方法,或者提出建议hhh(感觉后两篇写的比前面水)