预测房价实战

最新推荐文章于 2024-06-17 10:44:10 发布

HawardScut

最新推荐文章于 2024-06-17 10:44:10 发布

阅读量2k

点赞数 1

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hao5335156/article/details/80540020

版权

深度学习专栏收录该内容

18 篇文章 3 订阅

订阅专栏

1、pandas读取数据

把训练集和测试集处标签外合并，准备处理数据

2、预处理数据

连续数据：
如果一个特征的值是连续的，设该特征在训练数据集和测试数据集上的均值为μ，标准差为σ。那么，该特征的每个值将先减去μ再除以σ（就是我们将每个特征在所有样本上的值转归一化成均值0方差1）

μ \leftarrow 1 n \sum i = 1 n x i,

$\mu \leftarrow \frac{1}{n}\sum_{i = 1}^{n}x_i,$

σ 2 \leftarrow 1 n \sum i = 1 n (x i - μ) 2 .

$\sigma^2 \leftarrow \frac{1}{n} \sum_{i=1}^{n}(x_i - \mu)^2.$
归一化：

x i^\leftarrow x i - μ σ 2 + ϵ - - - - - \sqrt,

$\hat{x_i} \leftarrow \frac{x_i - \mu}{\sqrt{\sigma^2 + \epsilon}},$

ϵ ϵ $\epsilon$ 是一个很小的数，避免分母为0.
离散数值：
把离散数据处理成0、1…，比如，天气：晴天，雨天，多云3属性；原来的列“天气”变为3列“晴天，雨天，多云”，时候出现该天气用0，1表示，并把缺失数据值用本特征的平均值估计。

3、定义模型

比如，这里选线性函数做回归

4、定义训练函数

5、K 折交叉验证

这里进行调参，选出模型

6、预测

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
预测房价实战

1、pandas读取数据把训练集和测试集处标签外合并，准备处理数据2、预处理数据连续数据：如果一个特征的值是连续的，设该特征在训练数据集和测试数据集上的均值为μ，标准差为σ。那么，该特征的每个值将先减去μ再除以σ离散数值：把离散数据处理成0、1…，比如，天气：晴天，雨天，多云3属性；原来的列“天气”变为3列“晴天，雨天，多云”，时候出现该天气用0，1表示，并把缺失数据值用本...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。