1.导入库包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
2.查看当前挂载的数据集目录
#查看当前挂载的数据集目录
!ls /home/aistudio/data
Matplotlib
Matplotlib是一个帮助我们绘制数据的python库。通过它,你可以画出线图、散点图、等高线图; 条形图、直方图、3D 图形甚至是图形动画等等。
- 当横轴为时间时,使用线图
- 当两个变量存在相关性时,使用散点图
- 当想要观察数值数据的分布时,使用直方图
- 我们可以在图表中定义以下属性:颜色、标签、线宽、标题、不透明度、网格、图形大小、坐标轴刻度、线型等
#使用pandas从数据集中的csv文件写入数据
data = pd.read_csv('/home/aistudio/data/data225320/Pokemon.csv')
# 线图
# 绘制两条曲线,Speed和Defense;分别定义颜色,线宽,不透明度,网格,线型等属性
data.Speed.plot(kind = 'line', color = 'blue',label = 'Speed',linewidth=1,alpha = 0.5,grid = True,linestyle = ':')
data.Defense.plot(color = 'red',label = 'Defense',linewidth=1, alpha = 0.5,grid = True,linestyle = '-')
plt.legend(loc='upper right') # 在图像中显示标签
plt.xlabel('x axis') # 定义X轴名称
plt.ylabel('y axis') # 定义y轴名称
plt.title('Line Plot') # 定义图像名称
plt.show() # 显示图像
# 散点图
# x = attack, y = defense
data.plot(kind='scatter', x='Attack', y='Defense',alpha = 0.5,color = 'red')
plt.xlabel('Attack')
plt.ylabel('Defence')
plt.title('Attack Defense Scatter Plot')
Text(0.5,1,'Attack Defense Scatter Plot')
# 直方图
# bins = 直方图中竖条区域的个数,这里我们设置为10个
data.Speed.plot(kind = 'hist',bins = 10,figsize = (6,5))
plt.show()
# clf():清除当前 figure 的所有axes
data.Speed.plot(kind = 'hist',bins = 50)
plt.clf()
# 由于使用了clf(),我们看不到绘制的图像
<Figure size 640x480 with 0 Axes>
字典
字典(dictionary)是另一种可变容器模型,且可存储任意类型对象。
字典的每个键(key)值 (value) 对用冒号 “ : ”分割,每个键值对之间用逗号 “ , ” 分割,整个字典包括在花括号 “ {} ” 中 ,格式如下所示:
例: dictionary = {'China' : 'Shanghai','England':'London'} 其中的China、England为“键”;Shanghai、London为“值”
# 创建一个字典
dictionary = {'spain' : 'madrid','usa' : 'vegas'}
# 打印字典中的keys和values
print(dictionary.keys())
print(dictionary.values())
dict_keys(['spain', 'usa'])
dict_values(['madrid', 'vegas'])
# 键必须是不可变的对象,如字符串、布尔值、浮点数、整数、元组
# 列表是可变的对象,不能作为键
# 键是唯一的,创建时如果同一个键被赋值两次,后一个值会被记住
# 值不需要唯一
dictionary['spain'] = "barcelona" # 将‘spain’对应的值从‘madrid’替换为‘barcelona’
print(dictionary)
dictionary['france'] = "paris" # 增加新的键/值对
print(dictionary)
del dictionary['spain'] # 删除键是‘spain’的条目
print(dictionary)
print('france' in dictionary) # 查看‘spain’是否在字典里
dictionary.clear() # 清空字典所有条目
print(dictionary)