10 、pandas-----DataFrame
10.1 创建dataframe对象
import numpy as np
import pandas as pd
df1 = pd.DataFrame(list('asdf'),columns=['M'])
print(df1)
print('%%%%%%%%%%%%%%%%%%')
df2 = pd.DataFrame(np.random.randint(10,100,(4,4)))
print(df2)
print('%%%%%%%%%%%%%%%%%')
dict_new = {
'names':['大王','wang2','wang3'],
'age':18,
'country':'中国',
}
df3 = pd.DataFrame(dict_new)
print(df3)
print(df3.dtypes)
print(df3.index)
print(df3.columns)
展示:
M
0 a
1 s
2 d
3 f
%%%%%%%%%%%%%%%%%%
x y z z2
0 36 67 88 20
1 69 43 86 37
2 68 79 22 11
3 59 61 18 13
%%%%%%%%%%%%%%%%%
age country names
0 18 中国 大王
1 18 中国 wang2
2 18 中国 wang3
dtype: object
RangeIndex(start=0, stop=3, step=1)
Index(['age', 'country', 'names', 'price'], dtype='object')
注意点:
1、dataframe对象创建可以通过一维数组和多维数组创建
2、可以指定行,列索引,index指定的是行索引,columns指定的是列索引
3、如果使用的是字典创建:
(1)字典的键名作为列索引
(2)单个的字符串或者数字,扩充到最大个数
(3)如果是多个元素,保证元素的个数是相同的
4、series对象的本质是一个一维数组加索引
dataframe对象的本质是多个series对象共用一个行索引
10.2 df对象的讲解
print('^^^^^^^^^^^^^^^^')
print(df3['names'])
print(df3['names'].values)
print(type(df3['names']))
展示:
A 大王
B wang2
C wang3
Name: names, dtype: object
['大王' 'wang2' 'wang3']
<class 'pandas.core.series.Series'>
注意点:
1、dataframe对象是由很多个series对象组成的,只不过这些series对象共享一个行索引
2、df[索引]获取了一列数据
print('查看当前df对象的详细信息')
print(df3.info())
展示:
查看当前df对象的详细信息
<class 'pandas.core.frame.DataFrame'>
Index: 3 entries, A to C
Data columns (total 4 columns):
age 3 non-null int64
country 3 non-null object
names 3 non-null object
price 3 non-null float64
dtypes: float64(1), int64(1), object(2)
memory usage: 120.0+ bytes
None
df3 = pd.DataFrame(dict_new,index=list('ABC'))
df3.index.name='index_name'
df3.columns.name = 'col_name'
展示:
col_name age country names price
index_name
A 18 中国 大王 1.23
B 18 中国 wang2 1.23
C 18 中国 wang3 1.23