- 博客(4)
- 收藏
- 关注
原创 数字识别篇 (一) : 了解数据和处理数据
房地产不太景气在每次开始之前都需要先运行以下代码,不报错方可继续# Python 的版本需要大于3.5 import sysassert sys.version_info >= (3, 5)# Scikit-Learn的版本需要大于0.20import sklearnassert sklearn.__version__ >= "0.20"import numpy as npimport os#绘图设置%matplotlib inlineimport matp
2021-04-16 23:24:05
2385
1
原创 加州房价篇 (三) : 模型的训练,评估和房价的预测
万事俱备!运行本篇文章代码时必须先按顺序运行加州房价篇 (一) : 了解数据和加州房价篇 (二) : 处理数据中的所有代码在正式开始之前,我们得先把我们的数据分成训练集(train set)和测试集(test set),因为要避免过度拟合(overfit),在中文里,矫枉过正的意思和过度拟合非常像,打个比方,我现在在和女生甲谈恋爱,我问甲喜欢什么样的男生,甲说她喜欢短头发的男生,还说她喜欢听歌,喜欢吃辣,合计一百条规矩,我按照这些标准去要求自己,和甲处的很好,后来因为一些原因我和甲分手了,我又和
2021-04-12 16:20:10
740
原创 加州房价篇 (二) : 处理数据
现在是时候对数据动一动手脚了运行本篇文章代码时必须先运行加州房价篇 (一) : 了解数据中的所有代码在正式处理数据之前,我们需要先把median_house_value(地区房屋均价)这一特征摘出来,这是我们的目标,无需处理housing_target = housing["median_house_value"].copy()housing = housing.drop("median_house_value", axis=1)处理数据还记得我们在加州房价篇 (一) : 了解数据中一开始
2021-04-12 16:10:39
560
原创 加州房价篇 (一) : 了解数据
加州房价篇 (一) : 了解数据让我们先从加利福尼亚州的房价说起如果没有接触过机器学习,需要先进行环境配置在每次开始之前都需要先运行以下代码,不报错方可继续# Python 的版本需要大于3.5 import sysassert sys.version_info >= (3, 5)# Scikit-Learn的版本需要大于0.20import sklearnassert sklearn.__version__ >= "0.20"import numpy as n
2021-04-12 15:59:51
1780
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人