Data Science入门教程

1.导入库包

import numpy as np 
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns  

2.查看当前挂载的数据集目录


#查看当前挂载的数据集目录
!ls /home/aistudio/data

Matplotlib

Matplotlib是一个帮助我们绘制数据的python库。通过它,你可以画出线图、散点图、等高线图; 条形图、直方图、3D 图形甚至是图形动画等等。

  • 当横轴为时间时,使用线图
  • 当两个变量存在相关性时,使用散点图
  • 当想要观察数值数据的分布时,使用直方图
  • 我们可以在图表中定义以下属性:颜色、标签、线宽、标题、不透明度、网格、图形大小、坐标轴刻度、线型等
#使用pandas从数据集中的csv文件写入数据
data = pd.read_csv('/home/aistudio/data/data225320/Pokemon.csv')
# 线图
# 绘制两条曲线,Speed和Defense;分别定义颜色,线宽,不透明度,网格,线型等属性
data.Speed.plot(kind = 'line', color = 'blue',label = 'Speed',linewidth=1,alpha = 0.5,grid = True,linestyle = ':')
data.Defense.plot(color = 'red',label = 'Defense',linewidth=1, alpha = 0.5,grid = True,linestyle = '-')
plt.legend(loc='upper right')     # 在图像中显示标签
plt.xlabel('x axis')              # 定义X轴名称
plt.ylabel('y axis')              # 定义y轴名称
plt.title('Line Plot')            # 定义图像名称
plt.show()                        # 显示图像
# 散点图
# x = attack, y = defense
data.plot(kind='scatter', x='Attack', y='Defense',alpha = 0.5,color = 'red')
plt.xlabel('Attack')              
plt.ylabel('Defence')
plt.title('Attack Defense Scatter Plot')
Text(0.5,1,'Attack Defense Scatter Plot')
# 直方图
# bins = 直方图中竖条区域的个数,这里我们设置为10个
data.Speed.plot(kind = 'hist',bins = 10,figsize = (6,5))   
plt.show()

# clf():清除当前 figure 的所有axes
data.Speed.plot(kind = 'hist',bins = 50)
plt.clf()
# 由于使用了clf(),我们看不到绘制的图像
<Figure size 640x480 with 0 Axes>

字典

字典(dictionary)是另一种可变容器模型,且可存储任意类型对象。

字典的每个键(key)值 (value) 对用冒号 “ : ”分割,每个键值对之间用逗号 “ , ” 分割,整个字典包括在花括号 “ {} ” 中 ,格式如下所示:

例: dictionary = {'China' : 'Shanghai','England':'London'} 其中的China、England为“键”;Shanghai、London为“值”

# 创建一个字典
dictionary = {'spain' : 'madrid','usa' : 'vegas'}
# 打印字典中的keys和values
print(dictionary.keys())
print(dictionary.values())
dict_keys(['spain', 'usa'])
dict_values(['madrid', 'vegas'])
# 键必须是不可变的对象,如字符串、布尔值、浮点数、整数、元组
# 列表是可变的对象,不能作为键
# 键是唯一的,创建时如果同一个键被赋值两次,后一个值会被记住
# 值不需要唯一
dictionary['spain'] = "barcelona"   # 将‘spain’对应的值从‘madrid’替换为‘barcelona’
print(dictionary)
dictionary['france'] = "paris"       # 增加新的键/值对
print(dictionary)
del dictionary['spain']              # 删除键是‘spain’的条目
print(dictionary)
print('france' in dictionary)        # 查看‘spain’是否在字典里
dictionary.clear()                   # 清空字典所有条目
print(dictionary)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值