pandas head 显示全部_Pandas与机器学习实例——肝炎数据集（1）

最新推荐文章于 2024-05-15 11:09:59 发布

weixin_39945679

最新推荐文章于 2024-05-15 11:09:59 发布

阅读量640

点赞数

文章标签： pandas head 显示全部

本文链接：https://blog.csdn.net/weixin_39945679/article/details/111665845

版权

这篇博客介绍了如何使用Pandas处理一个肝炎数据集，包括查看数据信息、处理缺失值（特别是用众数和均值填充）以及准备数据进行机器学习，如构建决策树。

摘要由CSDN通过智能技术生成

首先和大家分享一下数据：

链接：

https://pan.baidu.com/s/15gdftmUHVbkh4dA79eNsjQpan.baidu.com

提取码：jmx7

下面开始我们的实例学习之路~

（1）将文件导入我们的python中。（我用的是jupyter notebook ）

import numpy as np
import pandas as pd
df = pd.read_excel(r'C:UsersAdministratorDesktopdata_feiyan.xlsx',encoding='utf-8')

导入成功~

（2）查看数据的信息

data.head() #查看数据前五行

data.tail() #查看数据后几行

data.shape #查看数据的大小（几行几列），查看矩阵或数组的维数

http://data.info( ) #查看数据信息（数据类型。缺失值）

data.describe() #观察数据的描述性统计信息,观察是否有异常值

1、先用head（）看看数据长什么样：

df.head().T

注：由于列数较多，因此我们打印前5行的时候用（.T）转置了一下，从上面的结果可以看到，数据集中出现了较多的“？”。

出现“？”的情况，应该是由于数据缺失，然后在Excel表格中被默认写成“？”的形式，因此在进行实验之前，我们需要把“？”重新表现成缺失值的样子。

2、使用replace（）函数将“？”转换成缺失值。

df.replace('?',np.nan,inplace=True)</

关注