Python R 线性回归 高斯回归 比较

这篇博客通过公路一氧化碳数据对比了Python和R进行线性回归的实现。首先使用R的逐步回归选择最佳模型,然后用Python实现相同过程,最后引入高斯过程进行概率插值,结果显示高斯过程在小样本数据上的表现更优。文章讨论了高斯回归在假设放宽方面的优势以及统计学与机器学习在方法论上的差异。
摘要由CSDN通过智能技术生成
使用的数据是公路一氧化碳数据,相应细节可参见下面链接:
数据下载链接:http://www.statsci.org/data/general/cofreewy.html

R设定工作目录指令setwd
下面先使用R 的逐步回归选取AIC最小的普通线性模型实行最小二乘估计:

w = read.table("COfreewy.txt", header = T)
a = lm(CO~.,w)
summary(a)
b = step(a, direction = 'backward')
summary(b)
shapiro.test(b$res)

并后面使用斯皮尔曼正态检验,不能拒绝正态性假设。(0.05601)

下面给出上述过程的python简化版本:

from __future__ import division

import numpy as np 
import scipy as sci
import pandas as pd
from math import log
from sklearn import linear_model 
from sklearn.gaussian_process import GaussianProcess

from sklearn.cross_validation import LeaveOneOut

import itertools

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值