口袋妖怪数据处理

本文介绍了使用Python(pandas和numpy)对口袋妖怪数据进行处理的实验,包括数据导入、去重、基本信息分析、类型分布、数值排序、数据划分、总和验证以及Series的构造。
摘要由CSDN通过智能技术生成

     实验题

口袋妖怪数据处理

     实验目的和要求

1  目的:  掌握爬虫基础语法

2 、要求:  掌握pandas,numpy数据处理的方法

     实验内容

  1. 代码

# 首先要导入对应的模块

import pandas as pd

import numpy as np

df = pd.read_csv('data/pokemon.csv')

df.head()

# In[2]:

# df.shape

# 2.对于#重复的妖怪只保留第一条记录,解决以下问题:

# df_unique = df.drop_duplicates('#')

# In[3]:

# 1.查看基本数据信息,数据样本数量、每一列数据类型、是否有缺失数据

print(df.info())

x=pd.isnull(df).any()

print(x)

# 计算出每个特征有多少百分比是缺失的

percent_missing = df.isnull().sum() * 100 / len(df)

missing_value_df = pd.DataFrame({

    # 'column_name': df.columns,

    'percent_missing': percent_missing

})

missing_value_df.sort_values(by='percent_missing', ascending=False).head(10)

print(missing_value_df)

# 2.计算所有宝可梦宝贝的平均HP

avg=df['HP'].mean()

print("平均值:",avg)

# 3.数据集合中Type 1属性有哪些属性

print(df['Type 1'].value_counts())

# 4.将数据按照Attack列值进行排序(降序)

m=df.sort_values(by=["Attack"])

print(m)

# <div class="alert alert-info alert-dismissible">听了上述的讲解后,在巩固一下吧,练一练 <span class="label label-warning">时间20分钟</span>

# </div>

# Q1.将数据按照Total列的值进行划分,划分成三个部分,并统计每一部分的样本数量

a=df[df.Total<=300]

len1=len(a.index)

b=df[(300<df.Total )&(df.Total<=500)]

len2=len(b.index)

c=df[df.Total>500]

len3=len(c.index)

print(a)

print("a区域样本数量为:",len1)

print(b)

print("b区域样本数量为:",len2)

print(c)

print("c区域样本数量为:",len3)

# Q2.`HP, Attack, Defense, Sp. Atk, Sp. Def, Speed`进行加总,验证是否为`Total`值。

df_demo = df[['HP','Attack','Defense','Sp. Atk','Sp. Def','Speed']]

var = df_demo.sum(axis=1) == df['Total']

print(var)

# 【拓展】Q3.构造Series,取出物攻,超过120的替换为`high`,不足50的替换为`low`,否则设为`mid`

attck=df['Attack'].mask(df['Attack']>120,'high').mask(df['Attack']<50,'low').mask((df['Attack']<=120)&(df['Attack']>=50),'mid')

print(attck)

  1. 运行结果截图:

1基本数据信息

2类型缺失及占比

3 PH平均值及type1中属性

4  attack排序

5 分类及样本数量

6 total验证

7构造Series

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ଲଇଉକ ଲ ̊ଳ

多谢大哥赏赐

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值