Pokemon宠物小精灵数据初步探索

案例中使用宠物小精灵的相关数据进行分析,其中各列的列名意义为:

name宠物小精灵的名称
Type 1宠物小精灵的第一类型
Type 2宠物小精灵的第二类型
HP生命点数
Attack攻击强度
Defense防御强度
Sp.Atk特殊攻击强度
Sp.Def特殊防御强度
Speed速度
Generation世代数
Total综合能力(生命点数、攻击强度、防御强度、特殊攻击强度、特殊防御强度和速度的总和)
LengendaryTrue表示为传奇小精灵,False表示非传奇小精灵

首先调用Pandas和NumPy模块。

1.首先调用Pandas和NumPy模块。

import pandas as pd
import numpy as np

2.使用read_csv读取Pokemon.csv文件,存储在变量df中,使用head展示数据的前十行。

df=pd.read_csv('./input/Pokemon.csv')
df.head(10)

在这里插入图片描述

3.使用pd.set_option设置只显示DataFrame最多10行样本,中间部分样本用省略号略过。

pd.set_option('display.max_rows',10)
df

在这里插入图片描述

4.删除名为#的列。

del df['#']
df

在这里插入图片描述

5.将各列名改为中文, 参数inplace设置是否替换原数据。

new_name={'Name':'名称','Type 1':'第一类型','Type 2':'第二类型','HP':'生命点数','Attack':'攻击强度','Defense':'防御强度',
          'Sp. Atk':'特殊攻击强度','Sp. Def':'特殊防御强度','Speed':'速度','Generation':'世代数','Total':'综合能力','Legendary':'传奇小精灵'}
df.rename(columns=new_name,inplace='True')
df

在这里插入图片描述

6.分别查看数据表的行、列索引。

df.index

RangeIndex(start=0, stop=800, step=1)

df.columns

Index([‘名称’, ‘第一类型’, ‘第二类型’, ‘综合能力’, ‘生命点数’, ‘攻击强度’, ‘防御强度’, ‘特殊攻击强度’,
‘特殊防御强度’, ‘速度’, ‘世代数’, ‘传奇小精灵’],
dtype=‘object’)

7.查看第一类型的唯一值,有如下两种方法:

df['第一类型'].unique()

array([‘Grass’, ‘Fire’, ‘Water’, ‘Bug’, ‘Normal’, ‘Poison’, ‘Electric’,
‘Ground’, ‘Fairy’, ‘Fighting’, ‘Psychic’, ‘Rock’, ‘Ghost’, ‘Ice’,
‘Dragon’, ‘Dark’, ‘Steel’, ‘Flying’], dtype=object)

df['第一类型'].value_counts()

Water 112
Normal 98
Grass 70
Bug 69
Psychic 57

Steel 27
Fighting 27
Ice 24
Fairy 17
Flying 4
Name: 第一类型, Length: 18, dtype: int64

可以用以下方式将中间省略部分全部显示出来。
pd.set_option('display.max_rows',None)
df['第一类型'].value_counts()

Water 112
Normal 98
Grass 70
Bug 69
Psychic 57
Fire 52
Electric 44
Rock 44
Ghost 32
Dragon 32
Ground 32
Dark 31
Poison 28
Steel 27
Fighting 27
Ice 24
Fairy 17
Flying 4
Name: 第一类型, dtype: int64

8.使用df.loc[label]方法查看行标签为2、4小精灵的名称和综合能力。

df.loc[[2,4],['名称','综合能力']]

在这里插入图片描述

9.使用df.iloc[loc]方法查看行标签为5到10小精灵的名称和综合能力。

df.iloc[5:11,[0,3]]

在这里插入图片描述

10.通过切片方式查看df中前6个小精灵的数据。

df[:6]

在这里插入图片描述

11.查看攻击强度大于160的小精灵的所有数据。

df[df['攻击强度']>160]

在这里插入图片描述

12.查看传奇小精灵的数据,这里只展示前十行数据。

df[df['传奇小精灵']==True].head(10)

在这里插入图片描述

13.创建新列世代456,插入到df的最后一列,该列显示世代数为4、5和6的小精灵为True, 其他为False,随机选取10行数据进行展示。

df['世代数456']=df['世代数'].isin([4,5,6])
df.sample(10)

  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Pokemon数据集是一个包含了关于Pokemon宠物小精灵)的信息的数据集。这个数据集中收集了数百种Pokemon的属性、能力、技能、种族值等详细信息,可以用来进行各种数据分析和机器学习任务。 这个数据集中的属性信息包括每只Pokemon的种类、身高、重量、颜色等等。能力信息包括每只Pokemon的生命值、攻击力、防御力、速度等等。技能信息包括每只Pokemon可以使用的特殊技能、物理技能和状态技能。种族值则是一种用来表示Pokemon基础能力值的指标,能够影响Pokemon在战斗中的表现。 通过对Pokemon数据集进行分析,我们可以了解每个种类Pokemon的平均属性值、能力分布和技能种类等等。比如,我们可以分析哪些Pokemon的攻击力和速度高,哪些Pokemon的特殊防御力比较低,以及它们之间的关联性等。这对于创作游戏策略、进行角色平衡的调整等方面都有着重要的作用。 此外,Pokemon数据集还可以用于机器学习的任务。我们可以利用这些数据训练模型来预测Pokemon的属性、种族值等信息,或者构建一个可以根据Pokemon的属性和技能来推荐最佳战斗队伍的模型。这些模型可以在游戏中用于AI对战、自动战斗等功能。 总之,Pokemon数据集是一个提供了Pokemon相关信息的数据集,对于理解和分析Pokemon的属性、能力以及进行相关的机器学习任务具有重要意义。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值