Week1 Python学习之线性回归

lingzzz

已于 2022-01-26 22:31:32 修改

阅读量1.7k

点赞数 1

CC 4.0 BY-SA版权

文章标签： python sklearn 线性回归机器学习

于 2022-01-26 22:30:26 首次发布

本文链接：https://blog.csdn.net/lingzzz/article/details/122692954

#本文中所使用的数据集参考吴恩达的course课程题目，数据集下载地址：链接：百度网盘请输入提取码密码：mwcl

1 加载数据集并可视化

使用numpy科学计算库加载数据集中数据，并通过matplotlib库下plot函数进行绘制散点图。

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties

data = np.loadtxt('D:\ZacLing\mat\Study\ex1data1.txt',delimiter = ',')
x = data[:,0]
y = data[:,1]
plt.figure()
plt.plot(x,y,'k.')
plt.show()

2 sklearn版本

线性式（假设函数）：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

lingzzz

关注关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【再来一次吧~】Linear Regression（线性回归）|| 数据集 ex1data1.txt 和 ex1data2.txt || read_csx || GradientDescent

追光者♂：记录、分享、总结、提升，现象级专栏《Python从入门到人工智能》作者，无惧黑暗，坚信曙光

10-12

403

再来一次吧。机器学习之线性回归。

线性回归python实现(含数据集)

12-15

线性回归python实现(含数据集)，结构清晰，适合初学者学习

1 条评论您还未登录，请先登录后发表或查看评论

数据资源丨机器学习数据集汇总（附下载地址）

weixin_55633225的博客

04-04

880

机器学习数据集汇总

【亲测免费】数据挖掘线性回归数据集

最新发布

gitblog_06740的博客

04-22

384

数据挖掘线性回归数据集 数据集简介本数据集为数据挖掘线性回归数据集，是专门为数据挖掘课本中第六章回归案例实验而准备的资源。该数据集可以帮助学习者更深入地理解和掌握线性回归分析方法。使用说明 数据集包含多个字段，每个字段的意义请参考数据挖掘课本中第六章的相关内容。在使用数据集进行实验前，请确保已经掌握了线性回归的基本理论和相关算法。 数据集适用于数据挖掘、机器学习等相关领域的教学和科研活动。...

线性回归模型训练数据集

08-27

线性回归模型常用训练数据集，包含50_Startups.csv与studentscores.csv。

【机器学习实战】五、实现非线性回归模型案例

敷衍zgf的博客

01-03

1208

实现非线性回归模型案例

【报告】多元线性回归

qq_42680202的博客

11-29

948

答题结果 [试题1-答题思路] 1.首先打开终端模拟器，从根目录进入jupyter notebook 2.新开一个终端，创建文件夹/data/lr和/data/ans41,创建文件/data/ans41/ans_ans1.txt 3.在/data/lr目录下下载数据集 4.在jupyter notebook下切换到目录/data/lr，新建一个python3文件，用于编写执行代码...

Python机器学习之线性回归模型

蛋肠加蛋不加香菜的博客

04-28

1959

（1）如何get线性回归模型（2）如何用不同的评估指标评估预测模型（3）如何改变正则化的惩罚（改变alpha）

homework_week_1.rar_python_regression_回归python

09-23

总之，"homework_week_1.rar_python_regression_回归python"的主题涵盖了Python环境下的回归和分类学习，通过`Week+1+hw.md`和`Week+1+hw.pdf`文件，你可以系统地学习和实践这些概念和技术，从而提升你在数据分析和...

python多变量回归_python实现多变量线性回归(Linear Regression with Multiple Variables)

weixin_39940182的博客

12-04

2079

本文介绍如何使用python实现多变量线性回归，文章参考NG的视频和黄海广博士的笔记现在对房价模型增加更多的特征，例如房间数楼层等，构成一个含有多个变量的模型，模型中的特征为( x1,x2,...,xn)表示为：=1，则公式转化为：、加载训练数据数据格式为：X1,X2,Y2104,3,3999001600,3,3299002400,3,3690001416,2,232000将数据逐行读取，用逗号切...

【机器学习类神经网路】Week3 Homework 线性回归预测气温

qq_50143262的博客

03-14

3929

第三周主要学习sklearn里面的KNN和回归

LinearRegression

03-18

LinearRegression 线性回归 数据集Folds5x2_pp.csv 机器学习入门

Linear-Regression:选择最适合.csv（X，Y）中提供的数据的模型。简单线性回归

04-07

线性回归 选择最适合.csv（X，Y）中提供的数据的模型。简单的线性回归。给定模型 y = wX + b y = X ^ w + b y =我们^ X + b ###正在使用D2L框架。

多元线性回归python实现

12-20

使用python实现多元线性回归，内容包含数据源及代码实现

机器学习（3）-简单线性回归：数据集与源码下载

04-09

机器学习（3）-简单线性回归：数据集与源码下载数据集与源码下载。博客当中用到的源码与数据集

线性回归合集

07-26

线性回归，局部加权线性回归，ridge，lasso

机器学习2/100天-简单线性回归

zombee0的博客

08-21

285

Simple Linear Regression github: 100-Days-Of-ML-Code 假设X和Y之间是线性关系，基于自变量(independent variables)X，预测因变量(dependent variable)Y。目标是寻找最佳的线形关系，寻找线形关系使得预测值与实际值距离最小。 1.数据预处理导入Libraries 导入数据集 处理确实数据分...

基于线性回归根据饮食习惯和身体状况估计肥胖水平

ZHW-鲜橙大AI课题组的博客

06-03

2900

刘欢，女，西安工程大学电子信息学院，2023级研究生研究方向：机器视觉与人工智能电子邮件：2768691353@qq.com孙思伟，男，西安工程大学电子信息学院，23级研究生研究方向：深度强化学习与人工智能电子邮件：sunsiwei0109@163.com该数据集来自于UCL机器学习知识库,数据集包括墨西哥、秘鲁和哥伦比亚等国基于饮食习惯和身体状况的个体肥胖水平估计数据。

销售额预测python线性回归

12-30

### 使用Python进行销售额预测的线性回归实现 #### 数据准备与预处理为了构建有效的线性回归模型，首先需要准备好用于训练的数据集。这包括读取数据、探索数据分析以及必要的预处理工作。对于给定的任务，假设已经拥有了一个包含每周销售数量在内的CSV文件作为数据源。在实际操作前，应当先加载并查看部分数据以了解其结构： ```python import pandas as pd df = pd.read_csv('sales_data.csv') print(df.head()) ``` 接着按照如下方式完成数据可视化和标准化等前期准备工作[^2]: ```python import seaborn as sns import matplotlib.pyplot as plt from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split fig = plt.figure(figsize=(10, 4)) for w in [0, 1, 2, 3]: w_data = df[df['week'] == w]['num_sold'] sns.kdeplot(w_data, label=w) plt.legend() plt.show() def split_data(df): X = df.iloc[:, :-1].values y = df.iloc[:, -1].values.reshape(-1, 1) scaler = StandardScaler().fit(X) X = scaler.transform(X) X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.2, random_state=0) return X_train, X_test, y_train, y_test X_train, X_test, y_train, y_test = split_data(df) ``` 上述代码片段实现了对原始数据按周次展示销量密度图，并完成了特征缩放及划分测试集与训练集的工作。 #### 构建线性回归模型基于已有的`X_train`, `y_train` 训练样本集合，现在可以创建简单的线性回归器来进行拟合: ```python from sklearn.linear_model import LinearRegression model = LinearRegression() model.fit(X_train, y_train) # 输出模型参数 print(f'Intercept: {model.intercept_}') print(f'Slope coefficients: {model.coef_}') ``` 这里定义了一个标准的线性回归对象并通过调用`.fit()`方法让算法自动寻找最佳权重向量使得均方误差最小化。 #### 预测新数据的结果一旦模型被成功训练出来之后就可以利用它来做未来一段时间内的销售趋势预测了。具体做法是对未知的新输入执行变换后再传入之前建立好的估计函数得到相应的输出值。 ```python predictions = model.predict(X_test) # 将预测结果反标准化以便直观理解数值意义 scaler_y = StandardScaler().fit(y_train) predicted_sales = scaler_y.inverse_transform(predictions).flatten() actual_sales = scaler_y.inverse_transform(y_test).flatten() comparison_df = pd.DataFrame({ 'Actual Sales': actual_sales, 'Predicted Sales': predicted_sales}) print(comparison_df.head()) # 可视化比较真实值 vs 预测量 plt.scatter(actual_sales, predicted_sales) plt.xlabel('True Values ') plt.ylabel('Predictions ') plt.title('Sales Prediction Performance') plt.plot([min(actual_sales), max(actual_sales)], [ min(predicted_sales), max(predicted_sales)], color='red') plt.show() ``` 这段脚本不仅展示了如何应用训练后的模型去推测未来的销售情况，还提供了将这些预测转化为更易于解释的形式的方法；同时通过散点图形式对比了理论上的理想直线同实际情况之间的差距程度。