数据预处理学习(一)----------matplotlib

数据分析:

        基础概念:用适当方法对收集来的大量数据进行分析,帮助人们做出判断,以便采取适当行动。

        流程:提出问题——准备数据——分析数据——获得结论——成果可视化——...

        环境:vscode

        matplotlib:python底层绘图库,数据可视化图表。

绘制折线图:

示例一:

from matplotlib import pyplot as plt


x=range(2,26,2)
y=[15,13,14,5,17,20,25,26,24,22,18,15]

plt.plot(x,y)
plt.show()

效果如下:

需要改善的问题:

1、设置图片大小

#figure就是要画的图,figsize表示宽和高,设置图片大小,dpi是像素点个数,让图片更清晰
fig=plt.figure(figsize=(20,8),dpi=80)

2、保存到本地

#保存图片
plt.savefig("./t1.png")

3、描述信息(x轴y轴分别表示什么,这个图表示什么)

#添加描述信息
plt.xlabel("时间")
plt.ylabel("温度 单位(C)")
plt.title("10点到12点每分钟的气温变化情况")

4、调整xy的刻度的间距

#设置x轴的刻度
#plt.xticks(x)
#plt.xticks(range(2,26))
_xtick_lables=[i/2 for i in range(4,49)]
plt.xticks(_xtick_lables[::3])
#调整x轴刻度
_x=list(x)[::3]
_xtick_label=["{}点{}分".format(10+i//60,i%60) for i in _x]
plt.xticks(_x,_xtick_label,rotation=45)#rotation表示旋转的角度

5、线条的样式

plt.plot(x,y_1,label="自己",color="orange",linestyle=":",linewidth=5,alpha=0.4)

color:线条颜色

linestyle:线条风格

linewidth:线条宽度

alpha:透明度

6、标记出特殊的点

7、添加水印

8、设置旋转角度

plt.xticks(_x,_xtick_label,rotation=45)#rotation表示旋转的角度

9、设置显示中文

font = {'family' : 'MicroSoft YaHei',
              #'weight' : 'bold',
              #'size'   : '12'
        }
matplotlib.rc("font",**font)

10、绘制表格

#绘制网格
plt.grid(alpha=0.4)

11、添加图例

#添加图例
plt.legend(loc=4)

绘制散点图:

from matplotlib.patches import Polygon
import matplotlib.pyplot as plt
import matplotlib
import matplotlib.font_manager as fm
import math
import random

from numpy import dot

#设置中文
font = {'family' : 'MicroSoft YaHei',
              #'weight' : 'bold',
              #'size'   : '12'
        }
matplotlib.rc("font",**font)

y_3=[11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]
y_10=[26,26,28,19,21,17,16,19,18,20,20,19,22,23,17,20,21,20,22,15,11,15,5,13,17,10,11,13,12,13,6]


x_3=range(1,32)
x_10=range(51,82)

#设置图形大小
plt.figure(figsize=(20,8),dpi=80)


plt.scatter(x_3,y_3,label="3月份")
plt.scatter(x_10,y_10,label="10月份")

#调整x轴刻度
_x=list(x_3)+list(x_10)
_xtick_labels = ["3月{}日".format(i) for i in x_3]
_xtick_labels += ["10月{}日".format(i-50) for i in x_10]
plt.xticks(_x[::3],_xtick_labels[::3],rotation=45)

plt.legend(loc=1)

plt.xlabel("时间")
plt.ylabel("温度")
plt.title("标题")

plt.show()


绘制(纵向)条形图:

plt.bar(range(len(x)),y,width=0.5)

绘制(横向)条形图:

plt.barh(range(len(x)),y,height=0.5,color="orange")

示例二:

from matplotlib.patches import Polygon
import matplotlib.pyplot as plt
import matplotlib
import matplotlib.font_manager as fm
import math
import random

#设置中文
font = {'family' : 'MicroSoft YaHei',
              #'weight' : 'bold',
              #'size'   : '12'
        }
matplotlib.rc("font",**font)

a=["猩球崛起3:终极之战","敦刻尔克","蜘蛛侠:英雄归来","战狼2"]
b_16=[15746,312,4497,319]
b_15=[12357,156,2045,168]
b_14=[2358,399,2358,362]

p=0.2

x_14=list(range(len(a)))
x_15=[i+p for i in x_14]
x_16=[i+p for i in x_15]


plt.figure(figsize=(20,8),dpi=80)

plt.bar(range(len(a)),b_14,width=0.2,label="9月14日")
plt.bar(x_15,b_15,width=0.2,label="9月15日")
plt.bar(x_16,b_16,width=0.2,label="9月16日")


plt.xticks(x_15,a)

plt.legend()

plt.show()

效果:

绘制直方图:

示例:

from matplotlib.patches import Polygon
import matplotlib.pyplot as plt
import matplotlib
import matplotlib.font_manager as fm
import math
import random

from numpy import dot

#设置中文
font = {'family' : 'MicroSoft YaHei',
              #'weight' : 'bold',
              #'size'   : '12'
        }
matplotlib.rc("font",**font)

a=[131,  98, 125, 131, 124, 139, 131, 117, 128, 108, 135, 138, 131, 102, 107, 114, 119, 128, 121, 142, 127, 130, 124, 101, 110, 116, 117, 110, 128, 128, 115,  99, 136, 126, 134,  95, 138, 117, 111,78, 132, 124, 113, 150, 110, 117,  86,  95, 144, 105, 126, 130,126, 130, 126, 116, 123, 106, 112, 138, 123,  86, 101,  99, 136,123, 117, 119, 105, 137, 123, 128, 125, 104, 109, 134, 125, 127,105, 120, 107, 129, 116, 108, 132, 103, 136, 118, 102, 120, 114,105, 115, 132, 145, 119, 121, 112, 139, 125, 138, 109, 132, 134,156, 106, 117, 127, 144, 139, 139, 119, 140,  83, 110, 102,123,107, 143, 115, 136, 118, 139, 123, 112, 118, 125, 109, 119, 133,112, 114, 122, 109, 106, 123, 116, 131, 127, 115, 118, 112, 135,115, 146, 137, 116, 103, 144,  83, 123, 111, 110, 111, 100, 154,136, 100, 118, 119, 133, 134, 106, 129, 126, 110, 111, 109, 141,120, 117, 106, 149, 122, 122, 110, 118, 127, 121, 114, 125, 126,114, 140, 103, 130, 141, 117, 106, 114, 121, 114, 133, 137,  92,121, 112, 146,  97, 137, 105,  98, 117, 112,  81,  97, 139, 113,134, 106, 144, 110, 137, 137, 111, 104, 117, 100, 111, 101, 110,105, 129, 137, 112, 120, 113, 133, 112,  83,  94, 146, 133, 101,131, 116, 111,  84, 137, 115, 122, 106, 144, 109, 123, 116, 111,111, 133, 150]

#计算组数
d=5 #组距
num_bins=int((max(a)-min(a))/d)

plt.figure(figsize=(20,8),dpi=80)
# plt.hist(a,num_bins)
plt.hist(a,range(min(a),max(a)+d,d),density=1)

plt.xticks(range(min(a),max(a)+d)[::d])

plt.grid()

plt.show()

效果图:

条形图绘制成直方图:

from matplotlib.patches import Polygon
import matplotlib.pyplot as plt
import matplotlib
import matplotlib.font_manager as fm
import math
import random

from numpy import dot

#设置中文
font = {'family' : 'MicroSoft YaHei',
              #'weight' : 'bold',
              #'size'   : '12'
        }
matplotlib.rc("font",**font)

interval = [0,5,10,15,20,25,30,35,40,45,60,90]
width = [5,5,5,5,5,5,5,5,5,15,30,60]
quantity = [836,2737,3723,3926,3596,1438,3273,642,824,613,215,47]

plt.figure(figsize=(15,6),dpi=100)

plt.bar(interval,quantity,width=width)

sum=0
_x=[]
_x+=[interval[0]-width[0]/2]
interval+=[150]
for i in range(1,len(interval)):
    print(interval[i])
    print(width[sum])
    _x+=[interval[i]-width[sum]/2]
    sum+=1
    
print(_x)
# _x=[i-0.5 for i in interval]
plt.xticks(_x,interval)
plt.grid()
plt.show()





  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PyTorch是一个用于深度学习的开源框架,它提供了一组工具和接口,使得我们可以轻松地进行模型训练、预测和部署。在PyTorch中,数据处理是深度学习应用的重要部分之一。 PyTorch中的数据处理主要涉及以下几个方面: 1.数据预处理:包括数据清洗、数据归一化、数据增强等操作,以提高模型的鲁棒性和泛化能力。 2.数据加载:PyTorch提供了多种数据加载方式,包括内置的数据集、自定义的数据集和数据加载器等,以便我们更好地管理和使用数据。 3.数据可视化:为了更好地理解数据和模型,PyTorch提供了多种数据可视化工具,如Matplotlib、TensorBoard等。 下面是一个简单的数据预处理示例,展示如何将图像进行归一化和数据增强: ```python import torch import torchvision.transforms as transforms from torchvision.datasets import CIFAR10 # 定义一个数据预处理管道 transform_train = transforms.Compose([ transforms.RandomCrop(32, padding=4), transforms.RandomHorizontalFlip(), transforms.ToTensor(), transforms.Normalize(mean=[0.4914, 0.4822, 0.4465], std=[0.2023, 0.1994, 0.2010]) ]) # 加载CIFAR10数据集,进行预处理 trainset = CIFAR10(root='./data', train=True, download=True, transform=transform_train) trainloader = torch.utils.data.DataLoader(trainset, batch_size=128, shuffle=True, num_workers=2) ``` 在上面的例子中,我们首先定义了一个数据预处理管道,其中包括了对图像进行随机裁剪、水平翻转、归一化等操作。然后,我们使用PyTorch内置的CIFAR10数据集,并将其预处理后,使用DataLoader进行批量加载。这个过程可以帮助我们更好地管理和使用数据,同时提高模型的训练效率和泛化能力。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值