一、Numpy
1.为什么要实用Numpy?
Numpy是数据科学计算的基础模块,用于数据值计算
基于数组运算,效率高
拥有许多高级函数,可以对数据进行高效处理
可以进行线性代数相关运算
2.简单实用
导入Numpy库
import numpy as np
创建一个一维数组
a = np.array([2,4,5,7,-8])
创建一个二维数组
b = np.array([[1,2,3],[6,5,4]])
数组相乘
详细使用随后更新链接
二、Pandas
1.pandas介绍
pandas是专门用作数据处理和分析的,使用起来十分高效和简洁,拥有许多各种复杂的函数,其使用起来非常高效便捷,是数据分析领域使用最广泛的库之一。
2.简单使用
导入库
import pandas as pd
创建一个标准数组
ata = pd.DataFrame([[1,2,3],[4,5,6]],columns=['a','b','c'])
导入表格文件
data = pd.read_excel(r'C:\Users\86155\Desktop\bigdata\cckstrain.xls')
data.head(5)#只查看前五行
三、Matplotlib
Matplotlib用于做数据可视化
1.简单使用
导入库
import matplotlib.pyplot as plt
一个自变量,从0开始,最大值是10,一共1000个
x = np.linspace(0,10,1000)
一个sin函数
y = np.sin(x)
绘图
plt.plot(x,y,label='y=sinx',color='red',linewidth=2)#专门画图的方法,x轴和y轴,图名称label,
plt.xlabel('Time')#x轴的名称
plt.ylabel('Vol')#y轴的名称
plt.title('this is line')#图的标题
plt.legend(loc = 'center')#对图例进行操作,图例放在什么位置。居中
plt.show()#打印出来