机器学习---导入数据、处理缺失值

集成开发环境

  • Spyder (前身是 Pydee) 是一个强大的交互式 Python 语言开发环境,提供高级的代码编辑、交互测试、调试等特性,支持包括 Windows、Linux 和 OS X 系统。
  • 下载Anaconda之后,打开Spyder环境:
    在这里插入图片描述
    在这里插入图片描述

原始数据展示

  • 是.csv文件
    在这里插入图片描述

主要函数介绍

data.iloc()函数

  • 属于pandas库,功能:从数据表中提出想要的数据。
  • 其中,i 表示只接受整型的参数;loc表示location。

在这里插入图片描述

dataset.iloc[0]

在这里插入图片描述

dataset.iloc[:,:-1]

在这里插入图片描述

dataset.iloc[:,3]

在这里插入图片描述

dataset.iloc[1:3,1]

取左不取右。
在这里插入图片描述

mean()

这个函数在excel中也表示用来求平均数。
在这里插入图片描述

可执行代码

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

dataset=pd.read_csv('Data.csv')
# 自变量包括所有的行,除最后一列之外的列
x=dataset.iloc[:,:-1]
# 因变量包括所有的行,最后一列
y=dataset.iloc[:,3]
# 处理缺失值
X['Age'] = X['Age'].fillna(X['Age'].mean()) #median
X['Salary'] = X['Salary'].fillna(X['Salary'].mean()) #median

导入结果展示(缺失值处理前)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

缺失值处理后

在这里插入图片描述

我的写在最后

学习资料来自荔枝微课。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一只天蝎

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值