2019.12.4大数据导论作业实验4可视化分析

2019.12.4大数据导论作业实验4可视化分析

(处女博,要是觉得写不好…我也不管)
好,开始进入正题。
首先,把大数据平台里可视化教程里的所有模块给引入。

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np

(要是这上面代码读不懂,先看博客最后的内容)
开始读取给的泰坦尼克号数据集的路径了
而这一步,不能像以往一样直接查看属性,把数据集的路径复制黏贴上去,而是需要改动一下。
举个栗子:
在这里插入图片描述
把它改成:

survived = pd.read_csv('D:/大学/学习/untitled/titanic.csv')
//注意:变量survived不是数据集文件里面的表头的surrvied,这相当于c语言里的你定义的变量,你想定义成 sb = pd.read_csv('D:/大学/学习/untitled/titanic.csv')都是可以的
//这个东西的作用是读取数据集里面的内容。

就是\改成/,同时还要加上一个主文件名。(我也不知道为什么要把\改成/,求野生大佬解释一下)
然后就开始搬运大数据平台的代码了。
比如用seaborn画个不重合的散点图:
在这里插入图片描述
然后改成:

sns.stripplot(x='survived',y='age',data=survived,jitter=True)
plt.show()

(读不懂这串代码,先看博客最下面的内容)
这样就能画出生存率与年龄不重合的散点图。
其中x='survived’的survived是数据集里的表头survived,而y='age’的age的age在这里插入图片描述
在这里插入图片描述
同理可得,你可以把age换成fare,画出生存率与的生存率与票价不重合的散点图了。
(代码里的data=是为了引入数据框,大概意思可能也是从刚才被我定义的survived(这个不是数据集里的survived,)的这个变量所指向的数据值中拿画图要用的数据吧(具体怎么表述好我也不清楚))
其他图怎么画根据平台里的代码改一改其实都是差不多这样操作的。
然后至于点的颜色怎么改,点的形状,平台上也说的很清楚。
还有我发现有些模块里的画图的函数所输入的变量的数据类型只能是数字,或者有些只能一个是数字,一个是字符
还是举个栗子:
把上面的散点图代码改成这样子:

sns.stripplot(x='alive',y='who',data=survived,jitter=True)
plt.show()

当你满心欢喜以为可以的时候,你就会看到:
在这里插入图片描述
(脑壳疼)
这是因为数据集里面表头是who的数据是man、woman、child中的一个,而这些都不是数字,没法让函数画图。要用stripplot画图最起码有个变量是一个数字(应该是这样吧,我也是半桶水的水平)。
所以让赶ddl的大家方便点,现在总结一下平台里面的学习资料一些函数对数据集输入变量的要求:
Matplotlib绘图的:
除了饼图,好像都是要求数据类型是数字的…(刚才我试了一下).
Seaborn绘图的:
最起码一个变量是数字的:箱型图和小提琴图。
其他貌似都是要是两个都是要数字的。
最后给有需要的人说一下一些语法。
例如要读懂这些:

import seaborn as sns
//import就是引入模块,相当于c语言里#include <库函数的名字>
//as就是把模块再取个名字,这样要用这模块时我们打他名字就不用那么屁长屁长的了
sns.stripplot(x='survived',y='age',data=survived,jitter=True)
plt.show()
//sns是模块的名称(我们一开始取的别名)
//  . 是个运算符,是从sns这个模块里调用stripplot这个函数的意思
//  然后什么x,y,data,jitter就是函数画图要用的,要你输入变量。

另外还补充一下,要是遇到这种函数
又双举个例子:
在这里插入图片描述
改成就能用了:

fig = plt.figure()
plt.scatter(survived['survived'], survived['age'])
plt.show()
//survived[]的这个survived是一开始我自己定义的指向数据集的变量,就是改成什么都可以的那个,然后[]里面的就是数据集里数据的表头。

好了,祝大家明天考试顺利,我去抱高程佛脚了。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值