口袋妖怪数据处理

最新推荐文章于 2024-07-17 09:15:39 发布

ଲଇଉକ ଲ ̊ଳ

最新推荐文章于 2024-07-17 09:15:39 发布

阅读量667

点赞数

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_62949330/article/details/134045610

版权

本文介绍了使用Python（pandas和numpy）对口袋妖怪数据进行处理的实验，包括数据导入、去重、基本信息分析、类型分布、数值排序、数据划分、总和验证以及Series的构造。

摘要由CSDN通过智能技术生成

一、实验题目

实验四：口袋妖怪数据处理

二、实验目的和要求

实验四：

1 、目的：掌握爬虫基础语法

2 、要求：掌握pandas,numpy数据处理的方法

三、实验内容

代码

# 首先要导入对应的模块

import pandas as pd

import numpy as np

df = pd.read_csv('data/pokemon.csv')

df.head()

# In[2]:

# df.shape

# 2.对于#重复的妖怪只保留第一条记录，解决以下问题：

# df_unique = df.drop_duplicates('#')

# In[3]:

# 1.查看基本数据信息,数据样本数量、每一列数据类型、是否有缺失数据

print(df.info())

x=pd.isnull(df).any()

print(x)

# 计算出每个特征有多少百分比是缺失的

percent_missing = df.isnull().sum() * 100 / len(df)

missing_value_df = pd.DataFrame({

# 'column_name': df.columns,

'percent_missing': percent_missing

})

missing_value_df.sort_values(by='percent_missing', ascending=False).head(10)

print(missing_value_df)

# 2.计算所有宝可梦宝贝的平均HP值

avg=df['HP'].mean()

print("平均值：",avg)

# 3.数据集合中Type 1属性有哪些属性

print(df['Type 1'].value_counts())

# 4.将数据按照Attack列值进行排序(降序)

m=df.sort_values(by=["Attack"])

print(m)

# <div class="alert alert-info alert-dismissible">听了上述的讲解后，在巩固一下吧，练一练 <span class="label label-warning">时间20分钟</span>

# </div>

# Q1.将数据按照Total列的值进行划分，划分成三个部分，并统计每一部分的样本数量

a=df[df.Total<=300]

len1=len(a.index)

b=df[(300<df.Total )&(df.Total<=500)]

len2=len(b.index)

c=df[df.Total>500]

len3=len(c.index)

print(a)

print("a区域样本数量为：",len1)

print(b)

print("b区域样本数量为：",len2)

print(c)

print("c区域样本数量为：",len3)

# Q2.对`HP, Attack, Defense, Sp. Atk, Sp. Def, Speed`进行加总，验证是否为`Total`值。

df_demo = df[['HP','Attack','Defense','Sp. Atk','Sp. Def','Speed']]

var = df_demo.sum(axis=1) == df['Total']

print(var)

# 【拓展】Q3.构造Series，取出物攻，超过120的替换为`high`，不足50的替换为`low`，否则设为`mid`

attck=df['Attack'].mask(df['Attack']>120,'high').mask(df['Attack']<50,'low').mask((df['Attack']<=120)&(df['Attack']>=50),'mid')

print(attck)

运行结果截图：

图 1基本数据信息

图 2类型缺失及占比

图 3 PH平均值及type1中属性

图 4 attack排序

图 5 分类及样本数量

图 6 total验证

图 7构造Series

ଲଇଉକ ଲ ̊ଳ

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
口袋妖怪数据处理

口袋妖怪数据处理
复制链接

扫一扫

ଲଇଉକ ଲ ̊ଳ CSDN认证博客专家 CSDN认证企业博客

码龄3年

29: 原创

104万+: 周排名

16万+: 总排名

2万+: 访问

: 等级

391: 积分

1151: 粉丝

84: 获赞

12: 评论

214: 收藏

私信

关注

热门文章

分类专栏

spark 1篇
Nosql 1篇
数据结构 19篇
c++程序设计 3篇

最新评论

网易云音乐歌单爬取
m0_74447478: 可以发源代码嘛
图的最小生成树算法
2301_81399078: 第四关过不了赶快解决
王者荣耀数据处理
「已注销」: 你好，你这边能定制王者荣耀提取对局评分吗
图的最小生成树算法
RZ_Crab: 为什么第四题不通过呀
顺序栈的基本操作及应用
CSDN-Ada助手: 恭喜您写了第18篇博客！标题“顺序栈的基本操作及应用”听起来非常有趣和实用。您的持续创作精神令人钦佩。在这篇博客中，您为读者提供了有关顺序栈的基本操作和应用的知识，这对于那些对数据结构和算法感兴趣的人来说无疑是非常有帮助的。鉴于您在这个领域的专业知识和经验，我想向您提出下一步的创作建议。或许您可以进一步探索顺序栈的高级操作和更复杂的应用情景，比如如何优化栈的性能或者在实际项目中如何应用栈的数据结构。通过分享您的见解和实践经验，您可以帮助更多的读者深入了解顺序栈，并且激发他们探索更多有趣的主题。感谢您的分享，并期待您未来更多精彩的博客！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

ଲଇଉକ ଲ ̊ଳ 多谢大哥赏赐

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。