单变量非线性变换

最新推荐文章于 2024-06-27 13:31:34 发布

Taohongfei_huster

最新推荐文章于 2024-06-27 13:31:34 发布

阅读量819

点赞数

分类专栏：机器学习特征工程 sklearn

本文链接：https://blog.csdn.net/qq_41951186/article/details/83065993

版权

线性模型和神经网络对特征尺度和分布敏感，非线性变换如log和exp能调节数据比例，改善模型学习效果。当特征与目标间存在非线性关系时，回归问题变得复杂。通过log变换，可以减少数据不对称性，提高模型拟合。在选择变换时，需要针对数据集和模型特点进行尝试。

摘要由CSDN通过智能技术生成

添加特征的平方或者立方可以改进线性回归模型，其他的变换通常也对变换某些特征有用，特别是应用数学函数，如log，exp或sin。虽然基于树的模型只关注特征的顺序，但线性模型和神经网络依赖于每个特征的尺度和分布。如果特征与目标之间存在非线性关系，那么建模就变得非常困难，特别是对于回归问题。log和exp函数可以帮助调节数据的相对比例，从而改变线性模型和神经网络的学习效果。此外，大部分模型都在每个特征（在回归问题中还包括目标值）大致遵循高斯分布时表现最好，也就是说，每个特征的直方图应该类似于熟悉的钟形曲线。

1.生成数据集

rnd = np.random.RandomState(0)
X_org = rnd.normal(size=(1000, 3))
w = rnd.normal(size=3)

X = rnd.poisson(10 * np.exp(X_org))
y = np.dot(X_org, w)

bins = np.bincount(X[:, 0])
plt.bar(range(len(bins)), bins, color='grey')
plt.ylabel("Number of appearances")
plt.xlabel("Value")

特征1和特征2具有类似的性质。

2.用岭回归训练原始数据集

最低0.47元/天解锁文章

Taohongfei_huster

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
单变量非线性变换

添加特征的平方或者立方可以改进线性回归模型，其他的变换通常也对变换某些特征有用，特别是应用数学函数，如log，exp或sin。虽然基于树的模型只关注特征的顺序，但线性模型和神经网络依赖于每个特征的尺度和分布。如果特征与目标之间存在非线性关系，那么建模就变得非常困难，特别是对于回归问题。log和exp函数可以帮助调节数据的相对比例，从而改变线性模型和神经网络的学习效果。此外，大部分模型都在每个特征（...
复制链接

扫一扫

专栏目录