Python——describe函数值输出含义/分位值的计算和含义

describe函数输出含义

NA数据已经删除

in:

print(adult["Hours-per-week"].describe())

#输出每周工作的小时总量

output:
在这里插入图片描述
count:总数
mean:平均值
std:方差
min:最小值
25%:25%分位数
50%:50%分位数
75%:75%分位数
max:最大值
Name:名字
dtype:数据类型

分位值:

25%分位值对应40.000000在这里意思是少于25%的人每周工作总量低于40。
75%分位值对应45.000000在这里意思是少于75%的人每周工作总量低于45。

分位值计算例子:

设有一组数据【1 8 5 2 3 6 4 1 2 9 7】

先从小到大排序

  1. 1
  2. 1
  3. 2
  4. 2
  5. 3
  6. 4
  7. 5
  8. 6
  9. 7
  10. 8
  11. 9

一共11个数,共10个数字间隔,每个四分位间10/4=2.5个数。

  • 计算25分位:
    第1个四分位数为上面11个数中的第1+2.5=3.5个数
    指的是第三个数+第三个和第四个数中间的0.5位置处,即:
    2+0.5*(2-2)= 2

  • 计算50分位:
    第2个四分位数为上面11个数中的第1+2.5*2=6个数
    即:4

  • 计算75分位:
    第3个四分位数为上面11个数中的第1+2.53=8.5个数
    指的是第八个数+第八个和第九个数中间的0.5位置处,即:
    6+0.5
    (7-6)=6.5

  • 6
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
好的,我来给你讲一下具体的步骤。 1. 数据编码 对于分类数据列,我们可以使用 LabelEncoder 对其进行编码。LabelEncoder 可以将每个类别映射为一个数字。例如: ```python from sklearn.preprocessing import LabelEncoder # 假设 data 是一个 DataFrame,其中 col1 和 col2 是分类数据列 le1 = LabelEncoder() data['col1_encoded'] = le1.fit_transform(data['col1']) le2 = LabelEncoder() data['col2_encoded'] = le2.fit_transform(data['col2']) ``` 2. 处理缺失 可以使用 Pandas 中的 fillna 方法来处理缺失。fillna 可以用指定的或方法来填充缺失。例如: ```python # 用平均填充所有缺失 data.fillna(data.mean(), inplace=True) ``` 3. 处理异常 可以使用 Pandas 中的 describe 方法来查看数据的基本统计信息,例如均、标准差、最小、最大等。根据这些信息,我们可以判断哪些是异常,并对其进行处理。例如: ```python # 假设 col3 是一个数列,根据 describe 方法查看其基本统计信息 print(data['col3'].describe()) # 发现 col3 中存在负数,将其替换为 0 data['col3'] = data['col3'].apply(lambda x: 0 if x < 0 else x) ``` 4. 输出列表 最后,我们可以使用 Pandas 中的 to_list 方法将 DataFrame 转换为列表。例如: ```python # 假设 data 是一个 DataFrame,我们想要输出其中的 col1_encoded、col2_encoded 和 col3 output_list = data[['col1_encoded', 'col2_encoded', 'col3']].values.tolist() print(output_list) ``` 以上就是处理分类数据的编码、缺失和异常,以及输出列表的步骤。希望对你有帮助!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值