Python数据清洗 - 1.4Pandas常用数据结构DataFrame和方法

1.4Pandas常用数据结构DataFrame和方法

通过pandas.DataFrame来创建DataFrame数据结构

pandas.DataFrame(data,index,dtype,columns)
说明:dataframe本身那就是一种表结构,因而在做数据分析时最常用。

data:列表、array、或dict

index:行索引

columns:列名或者列标签 # columns只针对dataframe数据结构,series没有该方法

import pandas as pd

1)通过列表(list)方式创建列表

list1 = [['张三',23,'男'],['里斯',27,'女'],['Sindy',21,'男'],['Jane',17,'女']] #使用嵌套列表
df1 = pd.DataFrame(list1,columns = ['姓名','年龄','性别'])
df1.head(5) #5表示共显示5行元素?
姓名年龄性别
0张三23
1里斯27
2Sindy21
3Jane17

2)通过字典(dict)方式创建列表

df2 = pd.DataFrame({'Name':['张三','里斯','Sindy','Jane'],'Age':[23,24,21,17],'Sex':['男','女','男','女']})
df2
NameAgeSex
0张三23
1里斯24
2Sindy21
3Jane17

3)通过数组(array)方式创建列表

import numpy as np
array1 = np.array([['张三',23,'男'],['里斯',27,'女'],['Sindy',21,'男'],['Jane',17,'女']])
df3 = pd.DataFrame(array1,columns=['姓名','年龄','性别'],index=['a','b','c','d'])
df3
姓名年龄性别
a张三23
b里斯27
cSindy21
dJane17

DataFrame的属性、方法:

df3.values
array([['张三', '23', '男'],
       ['里斯', '27', '女'],
       ['Sindy', '21', '男'],
       ['Jane', '17', '女']], dtype=object)
df3.index # 行索引标签
Index(['a', 'b', 'c', 'd'], dtype='object')
df3.columns # 列标签
Index(['姓名', '年龄', '性别'], dtype='object')
df3.columns.tolist() # 将数据结构转换成列表
['姓名', '年龄', '性别']
df3.ndim # 查看列表维度
2
df2.shape # 查看列表的形状(几行几列)
(4, 3)
df3.size # 查看元素个数
12
df3.dtypes # 查看每个列标签的数据类型,因为年龄是通过数组创建的object类型
姓名    object
年龄    object
性别    object
dtype: object
df1.dtypes # 这里年龄是整数型
df2.dtypes
Name    object
Age      int64
Sex     object
dtype: object
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值