策略建模--基于机器学习学习笔记-CSDN博客

本文链接：https://blog.csdn.net/xy773545778/article/details/79128882

本文介绍了机器学习策略建模中的三种特征选择方法：子集选择、收缩估计（如Lasso）和降维。接着，讨论了遗传算法在优化问题中的应用及其局限性。此外，详细讲解了神经网络的工作原理，包括如何通过梯度下降法优化权重，以及BP算法如何降低计算复杂度。最后，提到了RNN和LSTM在处理序列数据时的记忆机制。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 特征选择三种方法：
（1）选择子集从比如有300个特征集，以某种方式从中选一些子集来做计算预测
方式可以是暴力地设k=1到300，然后分别求出R^2值，然后再选R^2值相对大的子集们，衡量指标除了R^2也可以是AIC BIC。又或者是从300中选取1到300，就是排列组合的方法来依次求R^2
（2）收缩估计。构造一个罚函数使得得到一个精炼的模型，同时设定一些系数为0，保留了子集收缩的优点。例如lasso。
（3）降维。
2. 遗传算法
变异：随机从一条DNA链上选择一些位点，设定一个变异的步长范围，然后对选中的数作改变。
重组: 随机选择两两的对，在某个区域里互换

假如要在6人中选出有牛人血脉的人，每一个人都有一个适应度函数值，依次为每个人求出其fitness的概率值。然后再为每一个人都生成一个在0到1之间的随机数，看该随机数-概率是否大于0，大于0则选取该数，否则舍去。
这里写图片描述
遗传算法的缺点是当产生的种群较小的话，很难找到全局最优点。
3. 神经网络

w值作为一个权重，将输入的x放大后汇集到一起，判断x*w是否大于规定的阈值T，大于则输出1否则输出0.也可再加入一个偏项，该项x为-1，w为T，则最终输出只需判断是否大于0，即我们只要研究w值，不必求阈值T。