机器学习1--Pandas 数据结构 - DataFrame

本文详细介绍了Pandas DataFrame的创建方法,包括从数组、字典出发,并展示了如何设置行列索引。同时,讲解了如何通过loc属性查找特定行和特定值。DataFrame作为二维数据结构,兼具数组和字典特性,允许命名行列索引,提供了强大的数据操作能力。
摘要由CSDN通过智能技术生成

Pandas 数据结构 - DataFrame**

DataFrame 是一个表格型的数据结构。Pandas DataFrame 是一个二维的数组结构,类似二维数组。

DataFrame 构造方法如下:
pandas.DataFrame( data, index, columns, dtype, copy)

  • data:一组数据(ndarray、series, map, lists, dict 等类型)。
  • index:索引值,或者可以称为行标签。
  • columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
  • dtype:数据类型。
  • copy:拷贝数据,默认为 False。

1.用数组创建

import pandas as pd
data = [['Google',10],['Runoob',12],['Wiki',13]]
df = pd.DataFrame(data,columns=['Site','Age'])
print(df)

输出结果:
在这里插入图片描述
设置行列索引

import pandas as pd

data = [['Google', 10, 'N'], ['Runoob', 12, 'Y'], ['Wiki', 13, 'N']]
df = pd.DataFrame(data, index=['A1', 'A2', 'A3'], columns=['Site', 'Age', 'AA'])
print(df)

在这里插入图片描述
注意行列索引的数量要和数据的数量保持一致
2.以字典的形式创建

import pandas as pd
data = {'Site':['Google', 'Runoob', 'Wiki'], 'Age':[10, 12, 13]}
df = pd.DataFrame(data)
print (df)
import pandas as pd

data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]
df = pd.DataFrame(data)
print (df)

3.查找
3.1返回特定行

import pandas as pd

data = [['Google', 10, 'N'], ['Runoob', 12, 'Y'], ['Wiki', 13, 'N']]
df = pd.DataFrame(data, index=['A1', 'A2', 'A3'], columns=['Site', 'Age', 'AA'])
print(df.loc['A1'])
print(type(df.loc['A1']))

在这里插入图片描述
利用loc查找对应的行索引返回对应行,注意如果规定了行索引就不能使用数字索引查找了。如:这里创建时规定了行索引为 index=[‘A1’, ‘A2’, ‘A3’],则只能通过 df.loc[‘A1’] 查找到第一行的信息,如输入df.loc[0]就会报错。
输出的行信息格式为 key-value的Series

3.2 查找表格中的特定值

print(df.loc['A1']['Age'])
print(type(df.loc['A1']['Age']))

在这里插入图片描述
还是用loc属性
学到这里发现DataFrame跟二维数组有很大的相似性,不同的是Data Frame可以给行列索引命名。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值