博文配套视频课程:24小时实现从零到AI人工智能
图解Series与DataFrame
Series介绍
- Series是Pandas中的一维数据结构,类似于Python中的列表和Numpy中的Ndarray。
- Series是一维的,能存储不同类型的数据,有一组索引与元素对应。
import numpy as np
import pandas as pd
# 先创建一个Series(列)
ss = pd.Series(data=list('ABC'),index=list('abc'),name='title')
print(ss,ss.index,ss.name)
print(ss.values,type(ss.values))
print('-'*100)
DataFrame介绍
- DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表。
- DataFrame的单元格可以存放数值、字符串等,这和excel表很像。
- DataFrame可以设置列名columns与行名index。
- DataFrame每一列都是由Series构成。
# 创建一个DataFrame
df = pd.DataFrame(data=np.arange(12).reshape(3,4),index=list('abc'),columns=list('wxyz'))
# 显示整个df的结构,相关的列信息
df.info()
print(df,type(df))
print(df.columns,df.values,type(df.values))
print('获取某一列,个打印values的数据类型')
print(df['y'],type(df['y']))