线性回归既是一种数据挖掘与建模算法,也是统计学领域、计量经济学领域的常用学术建模方法,有何不同?

一.线性回归的基本形式

线性回归既是一种数据挖掘与建模算法,也是统计学领域、计量经济学领域的常用学术建模方法。在数据挖掘与建模领域,线性回归算法是一种较为基础的机器学习算法,其基本思想是将响应变量(因变量、被解释变量)和特征变量(自变量、解释变量、因子、协变量)描述成线性关系。

二.统计学领域、计量经济学领域的线性回归

统计学领域、计量经济学领域的线性回归主要关心的是估计的系数αβ,尤其是β,通过观察β的系数方向、大小以及是否具有统计学显著性,来验证参与分析的经济变量之间的关系,比如提升通货膨胀率是否有助于降低失业率等等。所以,对于β系数估计的有效性是比较高的。在构建线性回归方程、应用最小二乘法估计回归方程系数时,需要满足以下假设条件:

1) 假定特征之间无多重共线性。

2) 误差项之间相互独立,且均服从同一正态分布。

3) 误差项满足与特征之间的严格外生性假定。

4) 误差项满足自身的同方差假定。

5) 误差项满足自身的无自相关假定。

如果不满足这些假设条件,那么最小二乘法的适用性、估计系数的有效性就难以保证,从而学术研究的规范性也会受到质疑。

三.数据挖掘与建模领域的线性回归

而在数据挖掘与建模应用方面,模型致力于商业预测,比如研究客户的产品购买行为与年收入水平等变量之间的关系等,线性回归主要关心的是响应变量的实际值y与拟合值之间的差值是否足够小,特征变量的线性组合是否可以有效预测响应变量,因此,即使数据不满足那些假设条件,线性回归也可以积极使用,只要预测效果可以让人接受甚至令人非常满意,那么模型就可以被认为是适用的,可以用来进行预测。

响应变量的变化可以由α+βX组成的线性部分和随机误差项ε部分来解释。对于线性模型,一般采用最小二乘估计法来估计参数αβ,最小二乘估计法的基本原理是使残差平方和最小,残差就是响应变量的实际值y与拟合值之间的差值,其中响应变量的实际值y即为样本观测值的实际y值,而响应变量的拟合值即为基于样本观测值的实际X值以及估计出来的参数αβ。通过α+βX计算得到的、预测出来的值。

四.线性模型具有一定的稳定性

线性模型具有一定的稳定性。从技术角度来看,我们在评价模型的优劣时,通常从两个维度去评判,一是模型预测的准确性,二是模型预测的稳健性,两者相辅相成、缺一不可。关于模型预测的准确性,如果模型尽可能地拟合了历史数据信息,拟合优度很高,损失的信息量很小,而且对于未来的预测都很接近真实的发生值,那么这个模型一般被认为是质量较高的。而关于模型的稳健性,我们期望的是模型在对训练样本以外的样本进行预测时,模型的预测精度不应该有较大幅度的下降。一般来说,神经网络、决策树的预测准确性要优于线性回归、判别分析和Logistic回归分析等线性分析,但是其稳健性弱于线性分析。

五.统计分析、数据分析、挖掘方面有三个主流分支:统计学、计量经济学、机器学习

很多朋友问我,零基础如何入门统计分析、数据分析、数据挖掘?我想说的是:统计分析、数据分析、挖掘方面有三个主流分支:统计学、计量经济学、机器学习。这三个学科有所交叉,但也各自有侧重点。每个学校、每个专业具体情况不一样,但大多数都会选择其中一门或多门作为核心。根据我多年的教学经验,大家无论是学机器学习还是统计学、计量经济学,都建议结合着具体的软件或来学,对于不想走纯科研路线或者想成为理论大牛的大多数朋友来说,不建议过多研究数学公式,而是应一边学习知识原理,一遍上手操作,不然就会在复杂的推导面前耗尽了所有的学习热情。目前学习统计学实现工具最好用最流行的就是SPSS,学习计量经济学实现工具最好用最流行的就是Stata,而机器学习实现工具最好用最流行的就是Python,也比较好入手。所以,推荐学一门编程语言Python,加两个统计分析软件Stata、SPSS,这样几乎可以胜任统计分析与数据科学的各种场景,无论是在校搞学术还是职场搞数据都绰绰有余。

六.如何学习Python/SPSS/Stata?

在学习Python/SPSS/Stata时也不能光看视频,而是应该拿到具体的案例、源代码,一边学习一边操作,不断从学习中获得成就感,才会事半功倍,不然学了半天很容易学了就忘,那些代码估计也记不住,所以还是具体找些书好好的系统学习下。那么学习统计分析与数据科学应该看什么书?
1、《Python数据科学应用从入门到精通》张甜 杨维忠编著 清华大学出版社 2023年 适用于Python基础教学、数据分析、数据挖掘与建模、数据可视化、数据清洗等教学。国务院发展研究中心创新发展研究部第二研究室主任杨超 ,山东大学经济学院金融系党支部书记、副主任、副教授、硕士生导师张博,山东管理学院信息工程学院院长 袁锋 教授、硕士生导师,山东大学经济学院 刘一鸣 副研究员、硕士生导师,得厚投资合伙人 张伟民等一众大牛联袂推荐。

2、《Python机器学习原理与算法实现》杨维忠 张甜编著 清华大学出版社 2023年 适用于Python基础教学、数据分析、数据挖掘与建模、机器学习等教学。这本书在出版之前曾开发成9次系列课程,在某股份制银行全行范围类开展培训,490人跟随杨维忠老师上课学习(课程限报490人),培训完成后课程在知鸟平台上回放超过3万人次。很多银行员工通过这些学习一下子就学会了Python,并且用于工作中开展数据分析、机器学习、数据可视化等,这本书也被多家商业银行选做数字化人才培训教材,成为银行员工的一本网红书

3、《Stata统计分析从入门到精通》杨维忠 张甜编著 清华大学出版社 2022年 适用于Stata计量经济学、统计分析教学。国内计量大牛、山东大学陈强教授作序推荐,长期占据当当、京东、淘宝同类图书畅销榜前列。国内众多高校作为核心专业课程教材。

4、《Stata统计分析商用建模与综合案例精解》杨维忠 张甜编著 清华大学出版社 2021年 适用于Stata计量经济学、统计分析教学。国内众多高校作为核心专业课程教材。在51CTO举办的“2021年度最受读者喜爱的IT图书作者评选”中,《Stata统计分析商用建模与综合案例精解》荣获“数据科学领域最受读者喜爱的图书TOP5”。

5、《SPSS统计分析入门与应用精解(视频教学版)》杨维忠 张甜编著 清华大学出版社 2022年 适用于SPSS统计分析教学。同为国内计量大牛、山东大学陈强教授作序推荐,长期占据当当、京东、淘宝同类图书畅销榜前列。国内众多高校作为核心专业课程教材。

6、《SPSS统计分析商用建模与综合案例精解》杨维忠 张甜编著 清华大学出版社 2021年 适用于SPSS统计分析教学。国内众多高校作为核心专业课程教材。在51CTO举办的“2021年度最受读者喜爱的IT图书作者评选”中,《SPSS统计分析商用建模与综合案例精解》荣获“数据科学领域最受读者喜爱的图书TOP5”。

京东、当当、淘宝各大平台均在热销中,搜索书名即可。

创作不易,恳请大家多多点赞支持!也欢迎大家关注我,让我们一起学习Stata、SPSS、Python知识。多谢!

  • 28
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
### 回答1: 《数学算法与应用第二版》是一本与数学相关的教材,本书的目录pdf包含了书中各章节的概述和内容索引。书中主要包含以下几个部分: 第一部分为导论,介绍了数学的基本概念和基本步骤,以及一些数学工具和方法的基本知识。 第二部分为线性规划型与算法,详细介绍了线性规划型的立和求解方法。包括线性规划的几何解释、单纯形法、对偶理论等内容。 第三部分为非线性规划型与算法,介绍了非线性规划型的立和求解方法。包括一些常用的非线性规划算法,如牛顿法、拟牛顿法等。 第四部分为整数规划型与算法,讲解了整数规划问题的和求解方法。包括分支定界法、动态规划法等。 第五部分为随机规划型与算法,介绍了具有不确定性的数学型的立和求解方法。包括随机规划问题的拟、蒙特卡洛方法等。 第六部分为动态规划型与算法,讲解了动态规划问题的和求解方法。包括最优子结构、状态转移方程等内容。 第七部分为图论型与算法,介绍了图论在数学中的应用。包括最小生成树、最短路径、网络流等内容。 第八部分为多目标规划型与算法,讲解了多目标规划问题的和求解方法。包括帕累托最优解、权衡系数法等。 第九部分为拟与优化的融合,介绍了拟和优化方法的结合应用。 第十部分为金融数学与,讲解了金融数学在数学中的应用,包括股票价格型、期权定价等。 以上只是本书的大致目录,具体的各章节内容请查阅目录pdf。该书对于学习和应用数学的人来说是一本很好的参考书,内容丰富,涵盖了数学不同方面和方法。 ### 回答2: 《数学算法与应用第二版》是一本关于数学的教材,它提供了丰富的数学算法和应用示例。本书主要包括以下内容: 第一章介绍了数学的基本概念和方法论。它涵盖了数学的定义、目标和流程,以及在实际问题中应用数学的重要性。 第二章介绍了数学常用的最优化算法。这些算法包括线性规划、非线性规划和整数规划等,它们可以帮助我们找到问题的最优解。 第三章介绍了统计分析和预测型。它介绍了统计学常用的概率型、回归分析和时间序列分析等技术,这些技术可以帮助我们分析和预测问题的发展趋势。 第四章介绍了随机型和方法。它介绍了随机过程、蒙特卡洛拟和排队论等技术,这些技术可以帮助我们拟和分析问题的随机性。 第五章介绍了图论和网络分析。它介绍了图论的基本概念和算法,以及网络流和最短路径等应用问题的解决方法。 第六章介绍了动力系统和混沌理论。它介绍了动力系统的基本概念和数值解法,以及混沌理论在数学中的应用。 第七章介绍了整体优化和多目标决策。它介绍了整体优化技术、多目标决策方法和灰色系统理论等,这些技术可以帮助我们在多个目标之间做出合理的决策。 第八章介绍了人工智能和机器学习。它介绍了人工智能和机器学习的基本原理和算法,以及它们在数学中的应用。 通过学习《数学算法与应用第二版》,读者可以了解到数学的核心思想和常用方法,掌握数学中的各种算法和工具,并能够运用它们解决实际问题。这本书内容丰富全面,适合对数学感兴趣的学生和研究者阅读和参考。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据科学作家

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值