数模补充(2)数据预处理

一、背景

1.1脏数据

 1.2缺失值

1.3过程 

 1.4数据变换

简单函数变换

归一化

 1.5数据清洗

缺失值处理

python三次样条插值函数加补充篇数模补充(1)建模数值逼近处理 

 异常值处理

二、特征过程

2.1概念

2.2特征选择

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
好的,我可以帮你进行完善和优化代码,下面是我编写的代码: ```python # 导入所需的库 import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression from sklearn.metrics import mean_squared_error # 读取数据 data = pd.read_csv('data.csv') # 数据预处理 # 判断是否有缺失值 data.isnull().sum() # 如果存在缺失值,可以考虑使用均值或中位数填充缺失值 data.fillna(data.mean(), inplace=True) # 判断是否有异常值 data.describe() # 如果存在异常值,可以通过删除或者替换来处理 # 对数据进行标准化 scaler = StandardScaler() data_scaled = scaler.fit_transform(data) # 数据分析 # 绘制散点图 plt.scatter(data['feature1'], data['target']) plt.xlabel('Feature1') plt.ylabel('Target') plt.title('Scatter plot of Feature1 vs. Target') plt.show() # 绘制箱线图 data.boxplot(column=['feature1']) plt.title('Box plot of Feature1') plt.show() # 计算相关系数 corr_matrix = data.corr() corr_matrix['target'].sort_values(ascending=False) # 数据预测 # 划分训练集和测试集 X = data_scaled[:, :-1] y = data_scaled[:, -1] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) # 训练型 lin_reg = LinearRegression() lin_reg.fit(X_train, y_train) # 预测结果 y_pred = lin_reg.predict(X_test) # 计算均方误差 mse = mean_squared_error(y_test, y_pred) print('Mean squared error:', mse) # 数据可视化 # 绘制预测结果和实际结果的散点图 plt.scatter(y_test, y_pred) plt.xlabel('Actual values') plt.ylabel('Predicted values') plt.title('Scatter plot of actual vs. predicted values') plt.show() # 绘制残差图 residuals = y_test - y_pred plt.scatter(y_pred, residuals) plt.xlabel('Predicted values') plt.ylabel('Residuals') plt.title('Scatter plot of residuals') plt.show() ``` 这段代码实现了数据预处理数据分析、数据预测和数据可视化的功能,可以根据实际需求进行调整和修改。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

烟雨平生9527

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值