2、机器学习基础数据探索

本文介绍了在机器学习项目中使用Pandas库了解和处理数据的基础知识。通过加载澳大利亚墨尔本房价数据,展示了如何查看数据的描述性统计,如非缺失值数量、平均值、标准差以及数据分布的四分位数。文章还提到了数据中缺失值的原因,并预告了后续将处理缺失数据的主题。
摘要由CSDN通过智能技术生成

加载并理解您的数据。

本课程所需数据集夸克网盘下载链接:https://pan.quark.cn/s/9b4e9a1246b2
提取码:uDzP

文章目录

  • 1、使用Pandas了解你的数据
  • 2、解释数据描述

1、使用Pandas了解你的数据

任何机器学习项目的第一步都是熟悉数据。您将使用Pandas库进行此操作。Pandas是数据科学家用来探索和操纵数据的主要工具。大多数人在代码中将panda缩写为pd

In [1]:

import pandas as pd

Pandas库中最重要的部分是DataFrame。DataFrame包含您可能认为是表的数据类型。这类似于Excel中的工作表或SQL数据库中的表。

Pandas有强大的方法来处理你想用这种类型的数据做的大多数事情。

举个例子,我们来看看澳大利亚墨尔本的房价数据。在实践练习中,您将把同样的过程应用于一个新的数据集,该数据集包含爱荷华州的房价。

示例(墨尔本)数据位于文件路径melbourne housing snapshot/melb_data.csv

我们使用以下命令加载和浏览数据:

In [2]:

#将文件路径保存到变量以便于访问
melbourne_file_path = 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI算法蒋同学

你的鼓励将是我创作的最大动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值