- 问题:现有47个房子的面积和价格,需要建立一个模型对新的房价进行预测。
- 数据源:http://github.com/carefree0910/MachineLearning/blob/master_Data/price.text
该数据集比较简单,但是数据相当的大。保留他原始形式是有必要的。我们通过数据标准化处理对他做简单的处理以降低问题的复杂度
标准化的数学公式为:
数据规范化详见这个博主的:https://blog.csdn.net/weixin_38706928/article/details/80329563
我使用的jupyter notebook编译器(数据导入jupyter notebook有两种方法,一种是直接在notebook就新建一个txt文本直接复制粘贴就好,第二种是通过本地文档上传文件详见:http://www.cnblogs.com/annage/p/9430394.html
1、获取与处理数据
代码实现:
import numpy as np
import matplotlib.pyplot as plt
x,y=[], []
for sample