读取数据&线性回归

功能:
1 读取csv数据
2 转换数据格式
3 线性回归
4 1/x线性回归
5 绘制示意图

import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets, linear_model
from sklearn.metrics import mean_squared_error, r2_score
import pandas as pd
from pandas import Series,DataFrame 

data = pd.read_csv('test2.csv')
print(data.head())
#居然不能读取中文
data.columns=['年份','收入指数','失业率']
print(data.head())
y = data['失业率'].values
print(y)
x = data[['收入指数']].values
print(x)

regr = linear_model.LinearRegression()
# Train the model using the training sets
regr.fit(x,y)

print(regr.coef_)
y2 = regr.predict(x)
# Plot outputs
plt.scatter(x, y,  color='black')
plt.plot(x, y2, color='blue', linewidth=2)

plt.show()

y = data['失业率'].values
print(y)
x = data[['收入指数']].values
print(x)

regr2 = linear_model.LinearRegression()
# Train the model using the training sets
regr2.fit(1/x,y)

print(regr2.coef_)
x3 = np.arange(2.5,7.0,0.1)#此时是一维数组
print(x3)
x3 = np.expand_dims(x3, axis=1)#转二维数组
print(x3)
print(x)

y3= regr2.predict(1/x3)
# Plot outputs
plt.scatter(x, y,  color='black')
plt.plot(x, y2, color='blue', linewidth=2)
plt.plot(x3, y3, color='red', linewidth=2)

plt.show()

最终结果:
这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
读取CSV文件并应用线性回归模型是一种常见的数据分析任务。下面是一个简单的步骤来实现这个过程: 1. 导入所需的库:首先,你需要导入一些Python库,如pandas、numpy和sklearn。Pandas用于读取CSV文件,numpy用于处理数据,sklearn用于构建线性回归模型。 2. 读取CSV文件:使用pandas库的read_csv函数来读取CSV文件,并将其存储为一个DataFrame对象。例如,可以使用以下代码读取名为"data.csv"的文件: ``` import pandas as pd data = pd.read_csv("data.csv") ``` 3. 数据预处理:在应用线性回归模型之前,通常需要对数据进行一些预处理。这可能包括处理缺失值、处理异常值、特征选择等。根据你的具体需求,你可以使用pandas和numpy库来执行这些操作。 4. 划分数据集:将数据集划分为训练集和测试集是一个常见的做法。可以使用sklearn库中的train_test_split函数来实现。例如,可以使用以下代码将数据集划分为训练集和测试集: ``` from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) ``` 其中,X是特征变量,y是目标变量,test_size表示测试集所占比例,random_state用于随机划分数据集。 5. 构建线性回归模型:使用sklearn库中的LinearRegression类来构建线性回归模型。例如,可以使用以下代码构建模型并进行训练: ``` from sklearn.linear_model import LinearRegression model = LinearRegression() model.fit(X_train, y_train) ``` 6. 模型评估:使用测试集来评估模型的性能。可以使用sklearn库中的评估指标,如均方误差(Mean Squared Error)和决定系数(R-squared)。例如,可以使用以下代码计算均方误差: ``` from sklearn.metrics import mean_squared_error y_pred = model.predict(X_test) mse = mean_squared_error(y_test, y_pred) ``` 以上是一个简单的读取CSV文件并应用线性回归模型的过程。根据你的具体需求,可能还需要进行其他的数据处理和模型调优操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值