【算法】线性回归

我在思考要怎么学习回归算法,最基础的是线性回归(linear regression),那么或许还是从这一个部分入手

基础知识补充

概念

  y = ω x i + b \ y= \omega x_i +b  y=ωxi+b

  y = ω 1 x 1 + . . . + ω d x d + b \ y= \omega_1x_1+...+ \omega_dx_d +b  y=ω1x1+...+ωdxd+b

( ω ∗ , b ∗ ) = arg min ⁡ ( ω , b ) ∑ i = 1 m f ( ( x i ) − y i ) 2 = arg min ⁡ ( ω , b ) ∑ i = 1 m ( y i − ω x i − b ) 2 \begin{align*} (\omega^*,b^*) &= \text{arg} \min_{(\omega, b)} \sum_{i=1}^{m}f((x_i)-y_i)^2\\ &= \text{arg} \min_{(\omega, b)} \sum_{i=1}^{m}(y_i-\omega x_i-b)^2 \end{align*} (ω,b)=arg(ω,b)mini=1mf((xi)yi)2=arg(ω,b)mini=1m(yiωxib)2

线性回归

线性回归(Linear Regression):通过拟合一条直线(或高维空间中的超平面)来建立输入特征和输出之间的线性关系。

应用场景

线性回归是一种常见的统计学习方法,适用于以下多种应用场景:

  • 经济学:在经济学中,线性回归常被用于分析商品价格与需求量、劳动力市场的供求关系、国内生产总值与消费者支出之间的关系等。
  • 金融学:线性回归可用于预测股票价格、货币汇率、利率等金融指标,以及评估不同因素对投资组合收益的影响。
  • 医学:线性回归可用于分析药物剂量与疗效、生活方式与健康指标、环境因素与疾病发生率等医学研究问题。
  • 社会科学:线性回归可用于分析社会调查数据,如教育水平与收入、人口结构与犯罪率之间的关系。
  • 市场营销:线性回归可用于预测销售量、市场份额,以及分析广告投入与销售额之间的关系。
  • 环境科学:线性回归可用于分析气候变化趋势、环境污染与健康影响等环境科学问题。
  • 工程:在工程领域,线性回归可用于预测材料强度、构件的寿命、能源消耗等。
  • 地球科学:线性回归可用于分析地震活动、气候变化、海洋污染等地球科学领域的问题。

应用实例

2017年高教社杯全国大学生数学建模竞赛题目 C 题
  • 对附件Data2.xls中的数据,建立颜色读数和物质浓度的数学模型,并给出模型的误差分析。

数据来源:全国数学建模大赛

附件Data2.xls

import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

# 创建数据字典
data = {

}

# 创建 DataFrame
df = pd.DataFrame(data)

# 提取自变量和因变量  
X = df[['']]
y = df[['']]  

# 创建并训练线性回归模型
model = LinearRegression()
model.fit(X,y)


# 绘制数据散点图和线性回归模型
plt.scatter(X, y, color='blue')
plt.plot(X, model.predict(X), color='red', linewidth=2)
plt.xlabel('ppm')
plt.ylabel('B')
plt.title('线性回归模型拟合')
plt.show()

多元线性回归

多元线性回归(Multivariate Linear Regression) 有多个自变量与一个因变量之间的关系被建模为线性的形式。

  • 53
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
差分进化算法是一种基于群体智能理论的优化算法,通过群体内个体间的合作与竞争而产生的智能优化搜索算法。它是一种简单且易于实现的算法,具有如下特点: 1. 结构简单,容易使用。差分进化算法主要通过差分变异算子来进行遗传操作,由于该算子只涉及向量的加减运算,因此很容易实现。此外,差分进化算法的控制参数少,这些参数对算法性能的影响已经得到一定的研究,并得出了一些指导性的建议,因而可以方便使用人员根据问题选择较优的参数设置。 2. 性能优越。差分进化算法具有较好的可靠性、高效性和鲁棒性,对于大空间、非线性和不可求导的连续问题,其求解效率比其他进化方法好。而且很多学者还在对差分进化算法继续改良,以不断提高其性能。 3. 自适应性。差分进化算法的差分变异算子可以是固定常数,也可以具有变异步长和搜索方向自适应的能力,根据不同目标函数进行自动调整,从而提高搜索质量。 4. 具有内在的并行性,可协同搜索。差分进化算法具有利用个体局部信息和群体全局信息指导算法进一步搜索的能力。在同样精度要求下,差分进化算法具有更快的收敛速度。 5. 算法通用,可直接对结构对象进行操作,不依赖于问题信息,不存在对目标函数的限定。差分进化算法操作十分简单,易于编程实现,尤其利于求解高维的函数优化问题。 关于差分进化算法线性回归问题,差分进化算法本身并不是专门用于解决线性回归问题的方法。差分进化算法主要用于优化问题,可以用于求解非线性的优化问题,但对于线性回归问题,一般有更适合的方法,如最小二乘法。最小二乘法是一种常用的线性回归方法,它通过最小化实际观测值与回归模型预测值之间的残差平方和来估计回归模型的系数。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值