numpy官方文档
https://www.numpy.org.cn/
1、求DataFrame基本的标准差,方差,平均值
#求标准差
std=np.std(self.data['wage'])
print("标准差为"+str(std))
#求方差
variance=np.var(self.data['wage'])
print("方差为"+str(variance))
#求平均值
average=np.mean(self.data['wage'])
print("平均值为"+str(average))
2、将列表转化为二维数组
x=[2,4,6,7]
x=np.array(x)
x.resize((len(x),1))#(二维数组为len(x)个一维数组,每个一维数组中一个元素)
3、将二维数组转置
def t(self,num):
return np.transpose(num)#两种方式转置二维数组
#return list(map(list, zip(*x)))
4、数组的运算
def sub(self,A,B):#数列相减
return np.array(A)-np.array(B)
def log(self,num): #取对数
return [math.log(i)for i in num]
def t(self, num):#将二维数组转置
return np.transpose(num)
def pow(self, lists): # 计算平方
return [math.pow(i, 2) for i in lists]
def product(self,A,B):#计算两数相乘
return array(A)*array(B)
def plus(self, A, B): # 数列相加
return array(A) + array(B)
def average(self, A, B): # 取平均值
c = array(self.plus(A, B))
return c / 2
def sub(self,A,B):#数列相减
return array(A)-array(B)
def chu20(self,A):#除以20
A=array(A)
return A/20
def chu16(self,A):#除以16
A=array(A)
return A/16
5、计算dataframe的相关系数
self.datas=self.data[['tuit17','tuit18']]
print(np.corrcoef(self.datas.T))#计算相关系数
6、随机生成范围[0,6)有50个元素的数组
np.random.randint(0,6,50),