今天的错题积累内容

在Python的Pandas库中,`dropna()`方法是用于删除数据中所有的缺失值(错误原因:没有能够理解这个知识点)。因此,该方法可以删除数据中所有的缺失值,这是正确的。 

Pandas中的索引是基于Index类创建的Index对象是不可变的,但可以被不同的数据结构共享。

使用 `stack()` 方法后返回的是一个 Series,但前提是原 DataFrame 有多个级别索引(忽略了前面这个基础的前提条件)。 

2024年6月30日16:34:15-`transform()` 方法可以使用自定义函数,不仅限于内置方法。(自己对于这个方法的掌握不是很到位!他不会只是简单的限于内置的方法!) 

2024年6月30日16:36:15-`periods` 参数用于指定 `date_range()` 函数生成的时间戳数量(自己第一个内容没有进行一个实际的理解),当未指定结束日期时,此参数决定生成时间戳的总数。

2024年6月30日16:38:31-数据标准化通常是指对数值型数据进行标准化处理,而不是类别型特征。(对于其中的内容没有进行一个良好的理解!)

apply()方法能够实现所有agg方法的功能 -(这个知识点是一个正确的知识点!)

在箱形图中,超出上界和下界的值通常被称为“异常值”或“离群点”。这里的“上界”和“下界”指的是箱形图的“须”(whiskers)延伸到的位置。根据定义,箱形图的须通常延伸到最小值和最大值,但不超过以下范围:

  • 下须(下界):第一四分位数(Q1)减去1.5倍的四分位距(IQR,即Q3 - Q1)。
  • 上须(上界):第三四分位数(Q3)加上1.5倍的四分位距。

如果数据点低于下须或高于上须,这些点被认为是异常值。因此,如果“上界”和“下界”指的是箱形图须的端点,那么这句话是正确的。如果“上界”和“下界”被误解为箱形图的四分位数(Q1和Q3),那么这句话是错误的。通常在统计学中,箱形图的须是用来确定异常值的位置的。

  • 7
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值