文章目录
Numpy
numpy是什么
1、Numpy是Python的开源的数值计算扩展。
2、可用来存储和处理大型矩阵,比Python自身数据结构要高效。
3、Numpy将Python变成一种免费的强大的Matlab系统。
ndarray
1、三种创建方式:
a、从Python的基础对象转化。
import numpy as np
a=[1,2,3,4]
a
Out[18]: [1, 2, 3, 4]
x1 = np.array(a)
x1
Out[20]: array([1, 2, 3, 4])
type(x1)
Out[21]: numpy.ndarray
b、通过numpy内生的函数生成。
x = np.arange(11)
x
Out[23]: array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
c、从硬盘(文件)读取数据。
x = np.loadtxt('000001.csv',delimiter = ',',skiprows = 1,usecols = (1,4,6),unpack = False)
x.shape
Out[26]: (242, 3)
2、索引和切片
a、print c[1:5]
b、print c[:5]
c、print c[::-1]
3、常用函数
min ,max , median , mean(均值) ,variance(方差) ,sort
调用方法
a、np.func(x)
b、x.func()
import numpy as np
c =np.random.randint(1,100,10)
c
Out[32]: array([40, 29, 70, 48, 46, 17, 67, 96, 4, 26])
np.min(c)
Out[33]: 4
np.max(c)
Out[34]: 96
c.min()
Out[35]: 4
注意:
a、用np函数排序生成新序列,原序列不发生变换
b、用x.sort排序不生成新序列,原序列发生改变
散点图
散点图显示两组数据的值,每个点的坐标位置由变量的值决定。
由一组不连续的点完成,用于观察两种变量的相关性。
例如身高-—体重 温度—纬度等
相关性:正相关,负相关,不相关
import matplotlib.pyplot as plt
height = [161,170,182,175,173,165]
weight = [50,58,80,70,69,55]
plt.scatter(height,weight)
plt.show()
不相关
import numpy as np
import matplotlib.pyplot as plt
N =1000
x = np.random.randn(N)
y1 = np.random.randn(N)
plt.scatter(x,y1)
plt.show()
正相关(负相关则为-x)
import numpy as np
import matplotlib.pyplot as plt
N =1000
x = np.random.randn(N)
y = x+np.random.randn(N)*0.5
plt.scatter(x,y)
plt.show()
实例:股票价格涨幅(前一天和后一天对比)
import numpy as np
import matplotlib.pyplot as plt
open,close=np.loadtxt('000001.csv',delimiter = ',',skiprows=1,usecols=(1,4),unpack=True)
change =close - open
yesterday = change[:-1]
today = change[1:]
plt.scatter(yesterday,today)
plt.show()
说明:前一天和后一天涨幅变化为不相关
外观调整、
颜色:c 点大小:s 透明度:alpha 点形状:marker
#点大小为300,颜色为红色,形状为三角形,透明度为0.5
plt.scatter(yesterday,today,s =300,c = 'r',marker='<',alpha=0.5)