机器学习笔记 -吴恩达（第六章：线性回归，numpy实现、scikit-learn实现，附源码）

最新推荐文章于 2022-05-28 21:53:04 发布

MLANDAI

最新推荐文章于 2022-05-28 21:53:04 发布

阅读量2.2k

点赞数 3

分类专栏：机器学习-吴恩达

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tbb_1984/article/details/84290419

版权

（1）数据描述

1，使用pandas读取数据，简化后续操作

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

path = 'ex1data1.txt'
data = pd.read_csv(path, header=None, names=['Population', 'Profit'])
data.head()

2，绘制数据，看看数据样子

data.plot(kind='scatter', x='Population', y='Profit', figsize=(12,8))
plt.show()

3，定义一个损失函数，使用梯度下降算法

def computeCost(X, y, theta):
inner = np.power(((X * theta.T) - y), 2)
return np.sum(inner) / (2 * len(X))

公式：

4，为了使用向量进行计算，对数据做一些改造

在训练集中添加一列，以便我们可以使用向量化的解决方案来计算代价和梯度。

data.insert(0, 'Ones', 1)

cols = data.shape[1]

#特征数据集
X = data.iloc[:,0:cols-1]#X是所有行，去掉最后一列

#目标数据集
y = data.iloc[:,cols-1:cols]#X是所有行，只取最后一列

X.head()#head()是观察前5行

最低0.47元/天解锁文章

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
机器学习笔记 -吴恩达（第六章：线性回归，numpy实现、scikit-learn实现，附源码）

（1）数据描述1，使用pandas读取数据，简化后续操作import numpy as npimport pandas as pdimport matplotlib.pyplot as pltpath = 'ex1data1.txt'data = pd.read_csv(path, header=None, names=['Population', 'Profit'])dat...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。