ml自用文件

本文探讨了评价类算法(如层次分析、灰色综合评价、Topsis、模糊综合法)和预测类算法(如灰色预测、回归预测、时间序列分析)的原理、步骤、优缺点,强调了数据预处理中的缺失值和异常值处理,以及无量纲化和标准化方法的应用。文章还提到了神经网络和回归模型在不同场景下的适用性。
摘要由CSDN通过智能技术生成

一.常见的评价类算法

评价类算法:

层次分析法。就是去年清风讲的那个 具体怎么说呢 就是要注意层次矩阵的构建,必须要符合逻辑

灰色综合评价法,又叫灰色关联度分析,灰箱算法,有部分数据是给出的,不同于神经网络这种————遇强则强遇弱则弱。哈?如果我们的方案和最好的方案离得近,所以我们也是最好的。阿巴阿巴阿巴…os:这个最优指标是给出来的嘛好奇怪

基本步骤:

缺点:

总的来说 缺点只是相对水平,这个相对要建立在 相对是正确的时候,你的指标是需要符合逻辑的,不能站错了队假的指标,类似量纲化选择最多大,因为你可以选择所谓的最大的——但并不是数值最大就是最好的,所以在进行这部前,需要对数据,label进行无量纲化处理。感觉这点很重要。有一个好处是数据不需要任何分布要求,但是不是很适合大样本。

第一个比较主观

二者的缺点只能是比较出好坏。但不是绝对

可以加花 topsis?

Topsis也是可以附着在灰色综合评测法上的,所以这几个算法本质上有要求吗?这太离谱了…

新增:对,可以加花,实际上灰色综合评价法和topsis差不多,都是后驱的算法==。熵权法?新名词好像是万金油算法,客观赋权。但是好像是更准确的方法。有待考量。

新增:这两个算法并不能算是不同的算法,实际上大多数都是混合使用的,灰色综合评价正常来讲,各个label的权重都是一样的,比如说层次分析的矩阵为灰色综合评价取赋值可以进行融合使用

模糊综合法:评语集?大概是ABCD 一类 没有量化到分数级别那样 keyword:模糊关系矩阵,确定指标权重,进行模糊合成和做出评价。

优点:多因素  缺点还是存在主观性

用以上的方法 容易出事(主观)

并不能解决评价指标间相关造成的评价信息重复问题,隶属函数的确定还没有系统的方法,而且!台成的算法也有待进一步探讨。其评价过程大量运用了人的主观判断,由于各因素权重的确定带;有一定的主观性,因此,总的来说,模糊综合评判是一种基于主观信息的综合评价方法。

改进方法:(1)采用组合赋权法:根据客观赋权法和主观赋权法综合而得权系数。

类似乐理里面的加花

一般都是这么用的,老师也喜欢

Topsis算法:

原理和灰色相似,计算正负距离,离最好的近,离最小的远(灰色没有),

4.Bp神经网络综合评价(万精油类型==)

 和机器学习的方法相似?不确定,但是因为过于固有性,容易陷入局部最小值(可以理解为过拟合?)),类似深度和机器学习里面的玄学方法,可以记录在代码库中√

适用范围:大样本,复杂,神经网络算法比较适用,优化大概还是调优了,避免陷入局部最小值

新增:该算法为黑箱类型算法,连数据都没给都可以使用

一.常见的预测类算法

灰色预测思想?:核心是构建微分方程。

基本步骤:

1)数据检验与处理,判断数据列的级比是否都落在可容覆盖内,从而判断已知该数据列是否可进行灰色预测;

2)根据预测算法建立灰色模型得到预测值;

3)检验预测值----残差检验、级比偏差值检验;给出预测预报即结论。

灰色预测主要适用于少样本,短期预测,但是这里到底少是个什么水平还是有待考证,

2.回归预测

与大数据不同的是,因为数模的很多因子都是自己定的,所以有时候在回归分析中,选用何种因子采用何种表达式只是一种推测,这影响了因子的多样性和某些因子的不可预测性,使得回归分析在某些情况下收到限制,(就是说你凭啥这么预测,只有很明显的存在逻辑关系,才能这么适用==)

3.时间序列分析法

1)导入实验数据

2)确定ARA模型阶数。

3}残差检验。

4)给出结果

适用范围,用历史数据去推测未来的发展趋势,时间序列,在时间序列分析预测法处于核心的位置。

优点:

一般用ARMA梗型拟合时间序列,预测该时间序列未来值。Danicl检验平稳性。自动回归AR(Auto regressivc〉和移动平均M《Moving Aver age)预测模型,预测精度相对较高,适合中长期预测问题

缺点:

当遇到外界发生较大变化,往往会有较大偏差,时间序列预测法对于中短期预测的效果要比长期预测的效果好。

3微分方程:是灰色的退化版本。

做分方程模型是我们在日常生活中比较常见并且比较重要的一种模型,我们在平时的课程中时经常会涉及到这种题'型,像比如我们所逛到的牛顿第二定津就常迥到相关的问题。

微分方程模型步骤:

1)确定空际的量(所有要求的自变量,未知函数.必要参数)并确定坐标系。

2)找出这些量所存在的基本关系(物理、化学,生物、几何等关系)。

3)运用这些关系列出方程和定解条件-

有点是比较普适性

优点:

是短、中、长期的预测都适合"如传染病的预测模型、经济增长(或入己)的预测筷型、Lanchester战争预测模型。

缺点:

反应事物内部规律及其内在关系,但由于方程的建立是以局部规律的独立性假定为基础,当作为长期预测时,误差较大、且微分方程的解比较难以得到

三 优化类问题建模解析:

优化就是从很多方案中选出一种,使得资源最少 效益最高,

Sample 如何选择课程使得期末的gpa绩点最高。

第一步:看约束条件:

在这个问题中,决策变量是选择哪些课,目标函数为期末的GPA,约束条件为各门课程的上课时间安排、学校的学分要求、每门课的难易程度和自身的学习时间。

第二步:贪心算法:正常情况下,我们都会执行贪心的选课策略,在满足上课时间安排的情况下,选择自己最擅长且学分较高的课程、然后选择自己擅长但学分不高的课程,最后选择剩下的课程,直到满足学分要求。

11.课程笔记

摘要:本节课时主要讲述 数据预处理

个人理解:数据预处主要和大数据讲的预处理差不多 无非是异常值 缺失值等。但方法又各有不同。具体如下

  1. 缺失值的处理,个人认为删除缺失值在这种比赛里过于傻逼了,直接不考虑。

直接考虑填补,填补的简单方法就不赘述了,然后这里有个最紧邻插补法,需要数据对近邻的数据有逻辑关系(年份,地理位置)所以感觉行业什么用处QAQ。

而填补在高级方法上又有以下方法

  1. 回归填补——此处和大数据类似
  2. 拉格朗日插值法,和回归的意思相近但是本质上差别很大,具体在于回归的本质是二分,考虑的是一个最小的损失,但是在拉格朗日插值法中,所有的点都是要在模拟的函数上的,具体如下:
  3. 样条插值???空耳有些听不清啦——相邻点间刻画函数——每个点之间都是一个二次函数,工作量很大,需要一部分一部分的求解

所以那我们应该怎么选择呢???

截图如下

  1. 异常值的处理

3σ法则  箱线图,都是老方法啦 但是这里要注意好像3σ只能适用于正态分布的题,如果有别的就不行,例如公交站人数排队论符合泊松分布。(因为人数和上班下班啥啥啥的又很大的关系,所以不能用QAQ)

箱线图老朋友啦,但是还是奉上截图笔记:

12.课程笔记

摘要:数据变换

个人理解:统一量化标准O(∩_∩)O哈哈~

一 问题的数据指标 可能有 极大型(GPA),极小型(挂科率),中间型 和区间型(体重)

听到这里感觉和个人理解很不一样(?

这里给了个例子

截图

指标正向化处理 和 归一化没有任何的关系。

对于极小型,我们更加倾向于让他成为极大型,所以我们可以选择倒数或者是恒定值减去本身

Ok

接下来我们介绍中间型

这里需假设M 以及m是处于3 5 之间这样子,但是好像不是很容易明白,回头记得试一下、

区间性

在梯形中,越靠近中间的区间——即取值为1的区间,越近。

区间性和中间型有什么区别 一个是梯形(区间型),一个是三角形。

在现实中 区间型是更常见的 听课到此处 我似乎还是不明白这个技巧到底有什么用处。

3.2无量纲化处理

这里是说存在可能是某个x1的系数太过大了,出现大数吃小数的一个现象,从而导致结果的不合理,所以要考虑无量纲化,此处的指标可以理解为特征

1.标准差法:

Ps:有点类似归一化的思想 但是这里除以了一个标准差(确信),又叫规范化处理,让他成为正态分布。

2.极致差法

又名归一化,熊宇教的

看公式即可

使用场景:如果数据分布不均匀,则用这个方法(非正态分布),可以保留数据原有的特性

3.功效系数法

因为之前的数据都会分散在0-1中,所以这种方法应运而生

就是加了个花可以这么理解,见公式

同时做正向化和无量纲化:

不建议使用

普通方法:

建议使用

定性指标量化的处理方法

取大型柯西分布和对数函数作为隶属函数

4个参数是需要求的。但是这个参数是需要参数构建的,你可以理解为本身就可以主观臆定,但是非得这么做来显得很高大上。

预测类算法:

  1. 灰色预测:

结合几个数据建立方程,然后得到方程就可以喂数得结果了。

第一步——级比检验——数据间的比较,以达到要求。

第二部——灰色模型。

总结 :适合小体量,单调。

  1. 回归预测


    大数据专业算法。不赘述,但是回归容易跑偏~~
  2. 时间序列预测
    一定得是时序数据!!!更适合中长期。没有预测方法是真正适合长期预测的


    区别:时间序列可以视为灰色预测的加强版本,回归只能说是求规律,看总体分布,所以无脑上时间序列就可以了

微分方程
也是和回归一样的
 

  • 22
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值