创建数据集
import os #导入os类
os.makedirs(os.path.join(‘..’,’data’,exsit_ok =True)) #创建文件夹
data_file=os.path.join(‘..’,’data’,’house_tiny.csv’) #创建csv文件
with open(data_file,’w’) as f: #写入数据
f.write(‘Numrooms,Alley,Price\n’) #列名
f.write(‘3,NA,149999\n’) #每行数据
读取数据集
import pandas as pd #导入pandas类
data = pd.read_csv(data_file) #读取数据集文件
print(data) #打印数据
处理缺失值
data.iloc() #位置索引拆分
pd.get_dummies() #数值化NaN
转换为张量
import torch #导入torch类
X,y = torch.tensor(inputs.values),torch.tensor(outputs.values) #将inputs和outputs转换为张量格式
张量的长度
import torch
x=torch.tensor([0,1,2,3]) #创建张量
len(x) #张量长度,与之对应还有numel(x)
张量运算
x=torch.arange(20).reshape(5,-1) #生成5×4文件
x.T #x的转置
x.clone() #复制x
A=torch.arange(20).reshape(5,4) #创建5×4张量
A_sum_axis0=A.sum(axis=0) #张量沿着行方向降维求和
A_sum_axis1=A.sum(axis=1) #张量沿着列方向降维求和
A.mean() #对张量元素求平均
A.sum()/A.numel() #与mean等效
x=torch.tensor([0,1,2,3])
y=torch.tensor([1,1,1,1])
torch.dot(x,y) #张量点乘:对应元素相乘后相加
torch.mv(A,x) #张量矩阵向量积(矩阵-向量积乘法)
torch.mm(A,B) #张量矩阵-矩阵乘法
范数
u=torch.tensor([3,-4]) #创建张量
torch.norm(u) #求张量的L2范数,结果为5
torch.abs(u).sum() #求张量的L1范数,结果为7