主要是熟悉python对数据的一些操作
对数组的一些操作如下:
import numpy as np
import pandas as pd
arr1 = np.random.randint(10, size=(3, 3))
print(arr1)
arr2 = np.random.randint(10, size=(3, 3))
print(arr2)
arr3 = arr1 > arr2 # 生成bool型矩阵
print(arr3)
arr4 = np.cumsum(arr1, axis=0) # 每个元素累加
print(arr4)
arr5 = np.hstack((arr1, arr2))
print(arr5) # 横着拼
arr6 = np.concatenate((arr1, arr2))
print(arr6) # 竖着拼
arr7 = np.vsplit(arr1, 1)
print(arr7)
arr8 = np.split(arr1, 1, axis=0)
print(arr8)
l = arr1.ravel() # 按行展开
print(l)
ll = arr1.flatten('F') # 按列展开
print(ll)
对矩阵的操作:
matr1 = np.matrix('2,0,0;0,3,0;0,0,2')
print(matr1)
matr2 = np.matrix('9,8,7;6,5,4;3,2,1')
print(matr2)
print(matr1*2)
matr3=matr1+matr2
print(matr3)
matr4 = matr1 * matr2 # 矩阵乘法
print(matr4)
matr5 = matr1.dot(matr2) # 矩阵乘法
print(matr5)
matr6 = np.multiply(matr1, matr2) # 对应元素相乘
print(matr6)
print(matr1.T) # 转置
print(matr1.H) # 共轭转置
print(matr1.I) # 逆矩阵(奇异矩阵没有逆)
print(matr1.A) # 返回二维数组视图
print(np.linalg.det(matr1)) # 计算行列式
matr7=matr1.trace() #对角元素和
print(matr7)
print(np.linalg.eig(matr1)) #特征值和特征向量
print(np.linalg.qr(matr1)) #QR分解
print(np.linalg.svd(matr1)) #奇异值分解
matr8 = np.array([2, 3, 2])
print(np.linalg.solve(matr1, matr8)) # 求解线性方程组
对数据的操作:
lst=[1,3,5,6,10,23]
s=pd.Series(lst) #设置索引
print(s)
data=[['Google',10],['Runoob',12],['wiki',13]]
df=pd.DataFrame(data,columns=['Site','Age'])
print(df)
df=pd.DataFrame(np.arange(12).reshape(4,3),columns=['a','b','c'])
print(df)
df.insert(3,'d',np.ones(4))
print(df)
np.random.seed(666) #设置随机数种子,保证每次生成随机数都是一样的
data = {'name': ['Joe', 'Mike', 'Jack', 'Rose', 'David', 'Marry', 'Wansi', 'Sidy', 'Jason', 'Even'],
'age': [25, 32, 18, np.nan, 15, 20, 41, np.nan, 37, 32], 'gender': [1, 0, 1, 1, 1, 0, 0, 1, 0],
'isMarried': ['yes', 'yes', 'no', 'yes', 'no', 'no', 'no', 'yes', 'no', 'no']}
labels=['a','b','c','d','e','f','g','h','i','j']
df=pd.DataFrame(data,index=labels)