训练集数据在最后
线性回归简单算法手写草拟
1、导入python
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']#显示中文
2、展示数据,读入
path = '医院发收制服数据.txt'
data = pd.read_csv(path,header=None,names=['发制服', '收制服'])
data.head()#显示前5行
3、散点图
data.plot( kind='scatter',x='发制服', y='收制服', figsize=(12,8))
plt.show()
4、代价函数定义:代价函数J(Ѳ),预测函数和实际值的差值||方差
def Cost(X,y,theta):
inner = np.power(((X*theta.T)-y),2)
return np.sum(inner)/(2*len(X))
5、加入一列x,用于更新Ѳ
data.insert(0,'ones',1)
6、初始化X和y,代价函数是应该是numpy矩阵,转换X和Y 初始化theta
cols = data.shape[1]
X = data.iloc[:,