day9 python学习笔记 【generalized linear models】

# -*- coding: utf-8 -*-
"""
Created on Mon May 14 09:17:53 2018

@author: sun_y
"""

import numpy as np
import sklearn as sk
import os
import matplotlib.pyplot as plt
from scipy.stats import norm  
import pickle
from sklearn import linear_model



def load_dataset(filename):

    with open(os.path.join("E:\\python\\sklearn model",filename), 'rb') as f:

        return pickle.load(f)
    
    
data=load_dataset('basisData.pkl')
X=data['X']
y=data['y']
Xtest=data['Xtest']
ytest=data['ytest']
"""
x=np.random.rand(100,1)*20-10

mu=0
sigma=0.1
s= norm.rvs(0, size=(100,1), scale=0.5) 
y=0.5*x+10+s

"""
fig=plt.figure()
ax1=fig.add_subplot(321)
plt.scatter(Xtest,ytest)
ax1.set_title('linear regression')

reg=linear_model.LinearRegression()
reg.fit(X,y)
ypredict=reg.predict(Xtest)
plt.plot(Xtest,ypredict,'r')
test_error=np.mean((ypredict - ytest)**2)
print("Logistic Regression test error is %f" % test_error)

ax2=fig.add_subplot(322)
plt.scatter(Xtest,ytest)
ax2.set_title('Ridge Regression')

reg = linear_model.Ridge (alpha = 0.9)
reg.fit(X,y)
ypredict=reg.predict(Xtest)
plt.plot(Xtest,ypredict,'r')
test_error=np.mean((ypredict - ytest)**2)
print("Ridge Regression test error is %f" % test_error)

ax3=fig.add_subplot(323)
plt.scatter(Xtest,ytest)
ax3.set_title('Lasso')

reg = linear_model.Lasso(alpha = 0.9)
reg.fit(X,y)

ypredict=reg.predict(Xtest)
plt.plot(Xtest,ypredict,'r')
test_error=np.mean((ypredict - ytest)**2)
print("Lasso test error is %f" % test_error)

ax3=fig.add_subplot(324)
plt.scatter(Xtest,ytest)
ax3.set_title('BayesRidge')
reg = linear_model.BayesianRidge()
reg.fit(X,y)

ypredict=reg.predict(Xtest)
plt.plot(Xtest,ypredict,'r')
test_error=np.mean((ypredict - ytest)**2)
print("BayesRidge test error is %f" % test_error)




Linear Regression test error is 3393.869098
Ridge Regression test error is 3393.614383
Lasso test error is 26459.575158
BayesRidge test error is 26458.745573

 
但拟合效果不是很好,可继续尝试其他模型:RBF , Polynomial regression
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
《Dobson: generalised linear models》是一本介绍广义线性模型的书籍。广义线性模型是统计学中一种非常重要的模型,可以用于解决许多实际问题。在这本书中,Dobson先生详细介绍了广义线性模型的理论基础和实际应用。 首先,书中详细介绍了广义线性模型的数学背景和理论基础。它基于指数分布家族,并使用连接函数将线性预测器与响应变量相关联。读者可以学习到如何选择合适的指数分布家族和连接函数,以及如何推导出模型的估计参数。 其次,书中还介绍了广义线性模型的常见应用。这些应用包括二项分布模型、泊松分布模型和正态分布模型等。读者可以学习到如何通过使用广义线性模型来分析二元数据、计数数据以及连续数据等。 此外,书中还涵盖了广义线性模型的拟合和诊断。读者可以了解到如何使用最大似然估计方法来拟合模型,并使用残差图和假设检验来诊断模型的合适性和有效性。 最后,书中还介绍了广义线性模型的扩展,例如混合效应模型和广义估计方程。这些扩展使广义线性模型能够处理更加复杂的数据结构和数据类型。 总之,Dobson的《广义线性模型》是一本非常有用的统计学教材。它提供了广义线性模型的基本概念、理论和实践应用,为读者提供了丰富的知识和技能来进行统计分析和模型建立。无论是对于统计学学生、研究人员还是专业人士,这本书都是一本值得推荐的参考书籍。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值