机器学习笔记 -吴恩达(第六章:线性回归,numpy实现、scikit-learn实现,附源码)

(1)数据描述

1,使用pandas读取数据,简化后续操作

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

path =  'ex1data1.txt'
data = pd.read_csv(path, header=None, names=['Population', 'Profit'])
data.head()

2,绘制数据,看看数据样子

data.plot(kind='scatter', x='Population', y='Profit', figsize=(12,8))
plt.show()

3,定义一个损失函数,使用梯度下降算法

    def computeCost(X, y, theta):
          inner = np.power(((X * theta.T) - y), 2)
          return np.sum(inner) / (2 * len(X))

    公式 :

4,为了使用向量进行计算,对数据做一些改造

   在训练集中添加一列,以便我们可以使用向量化的解决方案来计算代价和梯度。

  data.insert(0, 'Ones', 1)


 cols = data.shape[1]

 #特征数据集
 X = data.iloc[:,0:cols-1]#X是所有行,去掉最后一列

#目标数据集
 y = data.iloc[:,cols-1:cols]#X是所有行,只取最后一列

X.head()#head()是观察前5行

y.head()

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值