机器学习-数据预处理(Data Preprocessing)

本文介绍了在Python的Spyder环境中和R环境下进行机器学习数据预处理的步骤,包括导入数据集、处理缺失数据、分类数据转换、特征缩放等操作。在Python中,使用Spyder的Variable explorer查看数据,并通过平均值填充缺失值;在R中,通过平均值处理缺失数据并使用特定包处理分类数据。同时,文章提到了将数据集划分为训练集和测试集的重要步骤。
摘要由CSDN通过智能技术生成
  • Spyder是Python(x,y)的作者为它开发的一个简单的集成开发环境。和其他的Python开发环境相比,它最大的优点就是模仿MATLAB的“工作空间”的功能,可以很方便地观察和修改数组的值。(安装过了就不重新安装了(o°ω°o)

Python环境下

  • 在Spyder中导入标准库:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
  • 导入数据集(在File explorer把路径切换到数据集所在位置):
dataset=pd.read_csv('Data.csv')
  • 在Variable explorer中可以点击查看数据集内容:
    ML

  • 设置自变量矩阵:

X = dataset.iloc[:, :-1].values

表示把数据集的所有行和除了最后一列外的所有列赋值给自变量矩阵X。
ML

  • 设置因变量向量:
y = dataset.iloc[:, 3].values

表示把数据集的所有行和最后一列(本数据集中最后一列为第3列)赋值给因变量向量y。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值