数据处理偏见数据处理

最新推荐文章于 2023-12-26 23:49:44 发布

weixin_45622770

最新推荐文章于 2023-12-26 23:49:44 发布

阅读量97

点赞数

分类专栏：数学建模算法

本文链接：https://blog.csdn.net/weixin_45622770/article/details/118788562

版权

5 篇文章 0 订阅

订阅专栏

该博客介绍了如何对pandas数据框进行数据预处理，通过计算评价分的平均值和标准差，筛选出评分在3个标准差范围内的数据。同时，展示了使用循环遍历numpy数组，找出并列出第五列中的唯一元素。这些步骤对于数据清洗和分析至关重要。

摘要由CSDN通过智能技术生成

偏见数据：

# r是pandas类型数据，9列为评价分列
num = r.iloc[:,9].values
left=num.mean()-3*num.std()
right=num.mean()+3*num.std()
r = r[left<r.评价分]
r = r[r.评价分<right]

筛选numpy数据b中第五列中的不同种数据

c=[]
for i in range(0,len(b)):
    if b[i][5] not in c:
        c.append(b[i][5])
print(c)
print(len(c))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注