pygam是Python专门训练gam的包,需要3.6以上的版本,
先加载数据
import pandas as pd
import os
from pygam import LinearGAM, s, f, l, te
from sklearn.preprocessing import LabelEncoder
current_dir = os.getcwd()
file_path = os.path.join(current_dir, 'NYCHousing2015.csv')
# Load the data
data = pd.read_csv(file_path)
print(data)
这个数据是matlab上面找的NYCHousing2015,
好了开始训练模型,
gam = LinearGAM(s(0)+s(1)+s(2)+s(8)+l(3)+l(4)+l(5)+l(6)+l(7)) # 这里0, 1, ..., n是特征列的索引
y = data["SALEPRICE"]
X = data.values
gam.fit(X[:,0:-1], y)
print(gam.summary())
这里我直接训练,报错了啊哈哈,原因是这个模型不能处理里面的字符串特征标签,那么我们需要做一下处理
label_encoder = LabelEncoder()
# 将非数值型的特征数据转换为整数标签
for column in data.columns:
if data[column].dtype == object: # 如果是对象类型(非数值型)
data[column] = label_encoder.fit_transform(data[column])
好了,看一下输出,